首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎中网络爬虫的研究

摘要第1-5页
Abstract第5-8页
第1章 引言第8-12页
   ·选题背景第8页
   ·关于搜索引擎与爬虫第8-10页
   ·论文主要内容及组织结构第10-12页
第2章 网络爬虫研究第12-27页
   ·通用爬虫研究第12-16页
     ·通用爬虫的工作流程第12-15页
     ·爬虫程序的实现方式第15-16页
   ·文本信息模型第16-18页
   ·主题爬虫原理第18-20页
   ·主题爬行策略第20-27页
     ·基于内容分析的爬行算法第21-24页
     ·基于链接分析的爬行算法第24-27页
第3章 基于Context Graph的主题爬行算法及其改进第27-42页
   ·基于Context Graph的主题爬行第27-34页
     ·构建Context Graph第29-31页
     ·训练阶段第31-33页
     ·爬行阶段第33-34页
   ·对基于Context Graph爬行算法的改进第34-42页
     ·特征选择理论第35-36页
     ·算法改进思想第36-42页
第4章 实验与结果分析第42-55页
   ·反向搜索模块第42-45页
   ·线程池工作模块第45-47页
   ·URL分析模块第47-48页
   ·Naive Bayes分类器的设计第48-52页
   ·实验结果与分析第52-55页
第5章 总结与展望第55-56页
参考文献第56-58页
致谢第58-59页
攻读硕士学位期间发表的论文和参与的项目第59页

论文共59页,点击 下载论文
上一篇:图像挖掘技术研究与应用
下一篇:基于Eclipse平台的实时软件研究与设计