首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

互联网舆情监控系统中聚焦爬虫的设计与实现

摘要第1-5页
ABSTRACT第5-11页
第一章 绪论第11-16页
   ·研究背景第11页
     ·中国互联网的发展第11页
     ·互联网中的舆情第11页
   ·国内外舆情监控系统研究现状第11-13页
     ·国内研究现状第11-13页
     ·国外研究现状第13页
   ·研究内容第13-14页
   ·论文结构第14-16页
第二章 互联网舆情监控系统分析第16-21页
   ·互联网舆情的特点第16-18页
     ·互联网舆情的发生场所第16-17页
     ·互联网舆情的阶段性发展第17页
     ·互联网舆情的反馈性发展第17页
     ·互联网舆情的衍生性发展第17-18页
   ·互联网舆情监控系统第18-19页
   ·互联网舆情监控系统的难点第19-20页
   ·本章小结第20-21页
第三章 聚焦爬虫的关键技术第21-33页
   ·JAVA技术第21页
   ·XML技术第21-23页
     ·XML简介第21-22页
     ·XML特性第22页
     ·XML在聚焦爬虫中的应用第22-23页
   ·搜索选择策略第23-26页
     ·IP地址搜索策略第23页
     ·深度优先搜索策略第23-24页
     ·广度优先搜索策略第24页
     ·深度与广度综合的搜索策略第24页
     ·最佳优先搜索策略第24-26页
   ·网页分析评价第26-30页
     ·基于网络拓扑的评价算法第26-27页
     ·基于网页内容的评价算法第27-30页
     ·基于用户习惯的评价算法第30页
   ·聚焦爬虫中的其它算法第30-32页
     ·隧道技术第30-31页
     ·CFC第31-32页
   ·本章小结第32-33页
第四章 舆情监控系统中聚焦爬虫的设计第33-45页
   ·项目背景第33页
   ·信息采集模块架构第33-34页
   ·聚焦爬虫功能分析第34-35页
   ·聚焦爬虫的设计特点第35-36页
   ·聚焦爬虫的主体架构第36-41页
     ·爬虫规则模块第37页
     ·爬虫控制模块第37-41页
     ·用户配置模块第41页
   ·聚焦爬虫模块交互第41-42页
   ·爬虫拒绝协议第42-44页
   ·本章小结第44-45页
第五章 舆情监控系统中聚焦爬虫的实现第45-70页
   ·聚焦爬虫的配置第45-46页
   ·聚焦爬虫对网页的抓取及解析第46-48页
     ·HTML网页的获取第46-47页
     ·链接的提取第47页
     ·网页正文提取第47-48页
   ·聚焦爬虫的爬行策略第48-54页
     ·舆情主题特征词库构建第48-49页
     ·主题特征向量的计算第49-51页
     ·内容的主题相关度第51-52页
     ·基于网页内容评价的爬行算法第52-53页
     ·爬行策略中K因子的影响第53-54页
   ·聚焦爬虫的去重第54-56页
     ·网页重复的特点第54页
     ·网页文本特征提取第54-55页
     ·传统的I-Match网页去重方法第55页
     ·改进的I-Match算法第55页
     ·改进后I-Match算法与传统I-Match算法比较第55-56页
   ·聚焦爬虫的调度第56-64页
     ·多任务调度问题第57页
     ·任务调度目的第57页
     ·传统Hash算法第57-58页
     ·传统Hash算法的不足第58-60页
     ·本文改进的一致性Hash算法第60-62页
     ·改进后一致性Hash算法与传统Hash算法比较第62-64页
   ·聚焦爬虫的实验结果与分析第64-68页
     ·聚焦爬虫的初始配置第64-65页
     ·种子页面的选取第65页
     ·聚焦爬虫的查全率第65-67页
     ·聚焦爬虫的查准率第67-68页
   ·本章小结第68-70页
第六章 舆情监控系统中聚焦爬虫的测试第70-74页
   ·聚焦爬虫的测试环境第70页
   ·聚焦爬虫的测试计划第70-71页
   ·聚焦爬虫的测试用例第71-73页
   ·聚焦爬虫的测试结果第73页
   ·本章小结第73-74页
第七章 总结与展望第74-75页
   ·论文工作总结第74页
   ·未来研究展望第74-75页
参考文献第75-78页
致谢第78-79页
攻读学位期间的研究成果第79页

论文共79页,点击 下载论文
上一篇:质检舆情监控系统中信息检索的研究
下一篇:IPv6关键技术的测试方法研究与实践