定制焦点信息聚合采集处理系统的设计与实现
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 引言 | 第9-15页 |
1.1. 选题背景与意义 | 第9-10页 |
1.2. 国内外研究现状 | 第10-11页 |
1.3. 主要工作和创新点 | 第11-13页 |
1.4. 论文的组织结构 | 第13-15页 |
第二章 信息采集处理相关技术介绍 | 第15-30页 |
2.1. 信息采集核心技术简介 | 第15-20页 |
2.1.1. 信息爬取技术分析 | 第15-16页 |
2.1.2. 信息更新技术分析 | 第16-18页 |
2.1.3. 信息过滤技术分析 | 第18-20页 |
2.2. 信息处理核心技术简介 | 第20-28页 |
2.2.1. 信息解析技术分析 | 第20-22页 |
2.2.2. 内容处理技术分析 | 第22-26页 |
2.2.3. 信息分类技术分析 | 第26-28页 |
2.3. 其他采集处理工具简介 | 第28-29页 |
2.4. 本章小结 | 第29-30页 |
第三章 系统需求分析及模块功能设计 | 第30-53页 |
3.1. 整体系统需求分析 | 第30-31页 |
3.2. 系统架构设计 | 第31-34页 |
3.2.1. 系统功能定位 | 第31-32页 |
3.2.2. 系统整体框图设计 | 第32-33页 |
3.2.3. 系统技术架构设计 | 第33-34页 |
3.3. 系统数据库设计 | 第34-37页 |
3.4. 信息采集模块设计 | 第37-44页 |
3.4.1. 垂直爬虫设计 | 第38-40页 |
3.4.2. 信息过滤策略设计 | 第40-42页 |
3.4.3. 信息更新策略设计 | 第42-44页 |
3.5. 信息处理模块设计 | 第44-51页 |
3.5.1. 正文抽取模块设计 | 第44-47页 |
3.5.2. 关键词抽取模块设计 | 第47-48页 |
3.5.3. 摘要抽取模块设计 | 第48-50页 |
3.5.4. 自动分类模块设计 | 第50-51页 |
3.6. 用户管理模块设计 | 第51页 |
3.7. 本章小结 | 第51-53页 |
第四章 系统核心功能实现 | 第53-74页 |
4.1. 信息采集模块的实现 | 第54-59页 |
4.1.1 垂直爬虫的实现 | 第54-57页 |
4.1.2. 信息过滤的实现 | 第57-58页 |
4.1.3. 信息更新的实现 | 第58-59页 |
4.2. 信息处理模块的实现 | 第59-68页 |
4.2.1. 正文抽取的实现 | 第59-62页 |
4.2.2. 关键词抽取的实现 | 第62-64页 |
4.2.3. 摘要抽取的实现 | 第64-66页 |
4.2.4. 网页分类的实现 | 第66-68页 |
4.3. 用户管理模块的实现 | 第68-73页 |
4.3.1. 用户注册及登录 | 第68-70页 |
4.3.2. 用户设置模块 | 第70-71页 |
4.3.3. 结果展示及下载模块 | 第71-73页 |
4.4. 本章小结 | 第73-74页 |
第五章 总结与展望 | 第74-76页 |
5.1. 论文工作总结 | 第74-75页 |
5.2. 进一步的研究工作 | 第75-76页 |
参考文献 | 第76-79页 |
致谢 | 第79页 |