首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

改进型实时爬虫的建模研究及其实现

摘要第1-7页
Abstract第7-12页
第1章 绪论第12-19页
   ·课题研究背景第12-15页
   ·课题研究意义第15-17页
   ·本文研究的主要内容和文章结构第17-19页
     ·本文研究的主要内容第17页
     ·文章结构第17-19页
第2章 爬虫理论基础和研究进展第19-29页
   ·搜索引擎第19-23页
     ·搜索引擎的定义第19页
     ·搜索引擎分类第19-20页
     ·搜索引擎设计需求第20-21页
     ·搜索引擎原理第21-23页
     ·网络爬虫的重要性第23页
   ·网络爬虫第23-29页
     ·网络爬虫定义第23-24页
     ·网络爬虫设计要求第24页
     ·网络爬虫原理第24-27页
     ·目前几个流行网络爬虫的比较第27页
     ·相关研究第27-29页
第3章 改进型实时爬虫模型设计第29-53页
   ·改进型实时爬虫的设计要求第29页
   ·改进型实时爬虫的策略分析第29-38页
     ·爬虫更新网页库的必要性第29-30页
     ·周期与增量策略第30-33页
     ·主动与被动策略第33页
     ·批量模式和稳定策略第33-35页
     ·覆盖和更新策略第35-36页
     ·本文改进的实时爬虫策略的推导结论第36-38页
   ·改进型实时爬虫的算法设计第38-47页
     ·实时抓取更新网页算法第39-43页
     ·确定网页创建或最后修改时间第43-45页
     ·实时抓取新创建网页算法第45-47页
   ·改进的实时爬虫工作流程第47-49页
   ·改进的实时爬虫的模型设计第49-53页
第4章 改进型实时爬虫性能分析第53-56页
   ·验证网页时间确定模块准确度第54-55页
   ·验证网页下次访问时间计算器第55-56页
第5章 总结与展望第56-57页
   ·本文总结第56页
   ·展望第56-57页
参考文献第57-59页
作者简介及在学期间所取得的科研成果第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于归一化互信息和遗传算法的医学图像配准研究
下一篇:新疆伊犁师范学院综合教务管理系统设计