首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题微博爬虫的设计与实现

摘要第1-5页
Abstract第5-8页
1 绪论第8-16页
   ·研究背景第8页
   ·搜索引擎发展现状第8-16页
     ·搜索引擎分类第9-11页
     ·搜索引擎的工作原理第11-12页
     ·主题搜索引擎与通用搜索引擎的区别第12-16页
2 相关理论及研究现状第16-23页
   ·搜索引擎理论与技术第16-21页
     ·搜索引擎的概念第16页
     ·搜索引擎的发展简史第16-18页
     ·搜索引擎的分类第18-19页
     ·搜索引擎技术简介第19-20页
     ·搜索引擎的系统结构第20-21页
   ·HTTP 协议第21-23页
     ·协议概述第21-23页
3 面向主题微博爬虫的系统体系结构设计第23-29页
   ·主题爬虫及相关理论技术第23页
   ·爬虫分类第23-25页
     ·通用网络爬虫工作原理及体系结构第23-25页
   ·主题网络爬虫工作原理及体系结构第25-27页
     ·主题爬虫的概述第25-26页
     ·主题爬虫工作原理第26-27页
   ·主题相关度和重要度判定模块的设计第27-29页
4 主题相关性判定关键算法研究与设计第29-39页
   ·基于网络拓扑的算法分析研究第29-30页
     ·PageRank 算法第29-30页
     ·HITS 算法第30页
   ·算法使用分析第30-31页
   ·基于网页内容的算法分析研究第31-32页
     ·纯文本分类与聚类算法第31-32页
     ·超文本分类和聚类算法第32页
     ·算法使用分析第32页
   ·基于主题的评价算法的设计第32-39页
     ·主题对象确立模块算法设计第33-34页
     ·初始种子优化模块算法设计第34-35页
     ·主题相关度分析模块算法设计第35-37页
     ·链接重要度分析模块算法设计第37-39页
5 主题微博爬虫系统的实现第39-44页
   ·网络爬虫的概要设计第39-40页
   ·网络爬虫总体设计第40-41页
   ·网络爬虫具体实现第41-44页
     ·爬取网页第41页
     ·分析网页第41-42页
     ·判断相关度第42页
     ·保存网页信息第42页
     ·多线程的实现第42页
     ·实验结果第42-44页
6 总结第44-46页
   ·论文工作的总结第44-45页
   ·下一步工作的展望第45-46页
参考文献第46-48页
致谢第48-49页

论文共49页,点击 下载论文
上一篇:分水岭算法与水平集算法在医学图像分割应用中的研究
下一篇:基于互信息和梯度信息的多模医学图像配准研究