摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
1 绪论 | 第12-17页 |
1.1 研究背景 | 第12-14页 |
1.1.1 企业文档管理 | 第12页 |
1.1.2 ECM系统与企业文档管理 | 第12-13页 |
1.1.3 文档电子化ECM系统 | 第13页 |
1.1.4 文档电子化ECM系统所面临的新环境和新问题 | 第13-14页 |
1.1.5 基于云的文档电子化ECM系统 | 第14页 |
1.2 课题的研究与实现意义 | 第14-15页 |
1.3 ECM系统的发展趋势 | 第15-16页 |
1.4 小结 | 第16-17页 |
2 系统需求分析 | 第17-29页 |
2.1 系统概述 | 第17-18页 |
2.2 需求分析 | 第18-22页 |
2.2.1 功能需求详述 | 第19-20页 |
2.2.2 成本性能需求详述 | 第20-22页 |
2.2.3 云平台带来的优势 | 第22页 |
2.3 云平台的选择 | 第22-25页 |
2.3.1 云方案的选择 | 第22-23页 |
2.3.2 亚马逊的云组件 | 第23-25页 |
2.4 文档自动分类算法研究 | 第25-27页 |
2.4.1 原系统的分类方法及所存在的问题 | 第25-26页 |
2.4.2 文本特征选择与分类方法 | 第26-27页 |
2.4.3 信息增益算法的引入 | 第27页 |
2.5 负载均衡需求分析 | 第27-28页 |
2.5.1 客户端与Web服务器端间的负载均衡 | 第28页 |
2.5.2 后台图像并行处理的负载均衡 | 第28页 |
2.6 小结 | 第28-29页 |
3 系统概要设计 | 第29-37页 |
3.1 系统架构 | 第29-36页 |
3.2.1 ScanGW Desktop | 第30-32页 |
3.2.2 ScanGW Web Service | 第32-34页 |
3.2.3 Atom发布协议 | 第34-35页 |
3.2.4 Cookai | 第35-36页 |
3.2.4.1 资源管理 | 第35页 |
3.2.4.2 系统的备份恢复 | 第35页 |
3.2.4.3 负载均衡 | 第35-36页 |
3.2.4.4 系统监视/配置管理 | 第36页 |
3.3 小结 | 第36-37页 |
4 系统详细设计 | 第37-61页 |
4.1 系统工作流程的详细设计 | 第37-45页 |
4.1.1 文档登录 | 第37-38页 |
4.1.2 文档分类以及标签抽出 | 第38-41页 |
4.1.3 文档检索 | 第41-43页 |
4.1.4 文档详细表示 | 第43-44页 |
4.1.5 与第三方SaaS相连接 | 第44页 |
4.1.6 同步与共享 | 第44-45页 |
4.2 文档自动分类的实现 | 第45-52页 |
4.2.1 原系统分类方法的实现 | 第45-49页 |
4.2.2 信息增益的计算方法 | 第49页 |
4.2.3 信息增益算法的导入与实现 | 第49-52页 |
4.3 文档自动分类的测试与分析 | 第52-56页 |
4.3.1 测试条件 | 第52页 |
4.3.2 测试对比分析 | 第52-55页 |
4.3.3 引入信息增益法的结论与评价 | 第55-56页 |
4.4 服务器资源的负载均衡设计 | 第56-57页 |
4.5 实现 | 第57-59页 |
4.6 基于仿真的实验 | 第59-60页 |
4.7 小结 | 第60-61页 |
5 系统实现与测试 | 第61-80页 |
5.1 系统实现 | 第61-73页 |
5.1.1 开发环境 | 第61页 |
5.1.2 接口详细 | 第61-70页 |
5.1.3 数据库表设计 | 第70-73页 |
5.2 性能测试 | 第73-79页 |
5.3 小结 | 第79-80页 |
6 结论与展望 | 第80-83页 |
6.1 结论 | 第80-81页 |
6.2 展望 | 第81-83页 |
参考文献 | 第83-85页 |
附录 | 第85-92页 |
致谢 | 第92-93页 |
攻读学位期间发表的学术论文目录 | 第93页 |