| 摘要 | 第1-5页 |
| ABSTRACT | 第5-11页 |
| 第一章 绪论 | 第11-16页 |
| ·研究背景 | 第11页 |
| ·中国互联网的发展 | 第11页 |
| ·互联网中的舆情 | 第11页 |
| ·国内外舆情监控系统研究现状 | 第11-13页 |
| ·国内研究现状 | 第11-13页 |
| ·国外研究现状 | 第13页 |
| ·研究内容 | 第13-14页 |
| ·论文结构 | 第14-16页 |
| 第二章 互联网舆情监控系统分析 | 第16-21页 |
| ·互联网舆情的特点 | 第16-18页 |
| ·互联网舆情的发生场所 | 第16-17页 |
| ·互联网舆情的阶段性发展 | 第17页 |
| ·互联网舆情的反馈性发展 | 第17页 |
| ·互联网舆情的衍生性发展 | 第17-18页 |
| ·互联网舆情监控系统 | 第18-19页 |
| ·互联网舆情监控系统的难点 | 第19-20页 |
| ·本章小结 | 第20-21页 |
| 第三章 聚焦爬虫的关键技术 | 第21-33页 |
| ·JAVA技术 | 第21页 |
| ·XML技术 | 第21-23页 |
| ·XML简介 | 第21-22页 |
| ·XML特性 | 第22页 |
| ·XML在聚焦爬虫中的应用 | 第22-23页 |
| ·搜索选择策略 | 第23-26页 |
| ·IP地址搜索策略 | 第23页 |
| ·深度优先搜索策略 | 第23-24页 |
| ·广度优先搜索策略 | 第24页 |
| ·深度与广度综合的搜索策略 | 第24页 |
| ·最佳优先搜索策略 | 第24-26页 |
| ·网页分析评价 | 第26-30页 |
| ·基于网络拓扑的评价算法 | 第26-27页 |
| ·基于网页内容的评价算法 | 第27-30页 |
| ·基于用户习惯的评价算法 | 第30页 |
| ·聚焦爬虫中的其它算法 | 第30-32页 |
| ·隧道技术 | 第30-31页 |
| ·CFC | 第31-32页 |
| ·本章小结 | 第32-33页 |
| 第四章 舆情监控系统中聚焦爬虫的设计 | 第33-45页 |
| ·项目背景 | 第33页 |
| ·信息采集模块架构 | 第33-34页 |
| ·聚焦爬虫功能分析 | 第34-35页 |
| ·聚焦爬虫的设计特点 | 第35-36页 |
| ·聚焦爬虫的主体架构 | 第36-41页 |
| ·爬虫规则模块 | 第37页 |
| ·爬虫控制模块 | 第37-41页 |
| ·用户配置模块 | 第41页 |
| ·聚焦爬虫模块交互 | 第41-42页 |
| ·爬虫拒绝协议 | 第42-44页 |
| ·本章小结 | 第44-45页 |
| 第五章 舆情监控系统中聚焦爬虫的实现 | 第45-70页 |
| ·聚焦爬虫的配置 | 第45-46页 |
| ·聚焦爬虫对网页的抓取及解析 | 第46-48页 |
| ·HTML网页的获取 | 第46-47页 |
| ·链接的提取 | 第47页 |
| ·网页正文提取 | 第47-48页 |
| ·聚焦爬虫的爬行策略 | 第48-54页 |
| ·舆情主题特征词库构建 | 第48-49页 |
| ·主题特征向量的计算 | 第49-51页 |
| ·内容的主题相关度 | 第51-52页 |
| ·基于网页内容评价的爬行算法 | 第52-53页 |
| ·爬行策略中K因子的影响 | 第53-54页 |
| ·聚焦爬虫的去重 | 第54-56页 |
| ·网页重复的特点 | 第54页 |
| ·网页文本特征提取 | 第54-55页 |
| ·传统的I-Match网页去重方法 | 第55页 |
| ·改进的I-Match算法 | 第55页 |
| ·改进后I-Match算法与传统I-Match算法比较 | 第55-56页 |
| ·聚焦爬虫的调度 | 第56-64页 |
| ·多任务调度问题 | 第57页 |
| ·任务调度目的 | 第57页 |
| ·传统Hash算法 | 第57-58页 |
| ·传统Hash算法的不足 | 第58-60页 |
| ·本文改进的一致性Hash算法 | 第60-62页 |
| ·改进后一致性Hash算法与传统Hash算法比较 | 第62-64页 |
| ·聚焦爬虫的实验结果与分析 | 第64-68页 |
| ·聚焦爬虫的初始配置 | 第64-65页 |
| ·种子页面的选取 | 第65页 |
| ·聚焦爬虫的查全率 | 第65-67页 |
| ·聚焦爬虫的查准率 | 第67-68页 |
| ·本章小结 | 第68-70页 |
| 第六章 舆情监控系统中聚焦爬虫的测试 | 第70-74页 |
| ·聚焦爬虫的测试环境 | 第70页 |
| ·聚焦爬虫的测试计划 | 第70-71页 |
| ·聚焦爬虫的测试用例 | 第71-73页 |
| ·聚焦爬虫的测试结果 | 第73页 |
| ·本章小结 | 第73-74页 |
| 第七章 总结与展望 | 第74-75页 |
| ·论文工作总结 | 第74页 |
| ·未来研究展望 | 第74-75页 |
| 参考文献 | 第75-78页 |
| 致谢 | 第78-79页 |
| 攻读学位期间的研究成果 | 第79页 |