首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎中主题爬虫的研究与实现

摘要第1-4页
Abstract第4-5页
目录第5-7页
1.绪论第7-11页
   ·课题背景第7-8页
   ·相关研究内容第8-10页
     ·搜索引擎第8-9页
     ·搜索引擎发展的国内外概况第9-10页
   ·本文研究内容及结构第10-11页
2.网络爬虫简介第11-19页
   ·网络爬虫在搜索引擎中的地位第11-13页
   ·网络爬虫的结构及基本原理第13-15页
   ·网络爬虫的分类及比较第15-16页
   ·主题页面在Web上的分布特征第16-17页
   ·主题爬虫的设计目标第17-18页
   ·本章小结第18-19页
3 网络爬虫的关键算法第19-33页
   ·主题爬虫的搜索策略第19-23页
     ·基于内容评价的搜索策略第19-23页
     ·基于链接结构评价的搜索策略第23页
   ·Web结构链接挖掘算法第23-29页
     ·PageRank算法第24-26页
     ·Authorities and hubs算法第26-28页
     ·两种算法的比较第28-29页
   ·主题相关性算法第29-32页
     ·向量空间模型(VSM)第29-31页
     ·页面主题相关性算法第31-32页
   ·本章小结第32-33页
4 主题爬虫的分析与设计第33-47页
   ·爬虫性能评价指标第33页
   ·SoftSpider系统的设计目标第33-37页
   ·设计关键点第37-40页
     ·队列管理及数据结构第37-38页
     ·多线程第38-39页
     ·机器人停止协议第39-40页
   ·搜索策略的选择第40-43页
   ·页面的解析第43-45页
     ·HTML语法的分析第43页
     ·网页中信息资源的提取第43-45页
   ·网络陷阱的预防第45页
   ·本章小结第45-47页
5 SoftSpider的实现第47-52页
   ·系统实现第47-49页
   ·实验及结果评价第49-51页
   ·本章小结第51-52页
6 总结与展望第52-53页
   ·本文总结第52页
   ·研究展望第52-53页
致谢第53-54页
参考文献第54-56页

论文共56页,点击 下载论文
上一篇:基于兰姆波叠前逆时偏移方法实现复合材料结构健康监测
下一篇:多点相位协调及纯模态试验研究