首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

深度网爬虫及更新策略研究

摘要第1-6页
ABSTRACT第6-12页
第一章 绪论第12-18页
   ·问题提出第12页
   ·研究目的和意义第12-14页
   ·国内外研究现状第14-15页
   ·主要研究工作和创新点第15-17页
     ·主要研究工作第15-16页
     ·本文的创新点第16-17页
   ·本文各章内容安排第17-18页
第二章 工作原理及关键技术第18-22页
   ·深度网爬虫工作原理第18页
   ·深度网爬虫关键技术第18-21页
     ·数据源发现和选择第18-19页
     ·查询接口处理第19-20页
     ·结果抽取与聚合第20-21页
   ·本章小结第21-22页
第三章 深度网爬虫系统设计第22-46页
   ·爬虫总体架构第22-24页
     ·概述第22-23页
     ·控制模块第23-24页
     ·内部模块第24页
     ·工具模块第24页
   ·爬虫各模块介绍第24-31页
     ·Crawler处理器第25-27页
     ·Extractor处理器第27-28页
     ·Frontier处理器第28-29页
     ·Query处理器第29-31页
   ·页面分类与过滤第31-34页
     ·预处理第31-32页
     ·实体识别第32页
     ·网页分类第32-34页
   ·半自动信息抽取第34-36页
   ·爬虫分布式设计第36-44页
     ·概述第36-39页
     ·总体结构第39-42页
     ·调度机制第42-43页
     ·控制机制第43-44页
   ·本章小结第44-46页
第四章 深度网爬虫更新策略第46-52页
   ·相关研究第46-47页
   ·增量爬虫研究第47-51页
     ·网页归类第47页
     ·更新算法第47-49页
     ·不同类别之间的优先级第49页
     ·实验数据第49-51页
   ·本章小结第51-52页
第五章 爬虫实验系统与测试分析第52-58页
   ·爬虫配置设置第52页
   ·抽取配置设置第52-53页
   ·分布式爬虫配置第53-55页
   ·爬虫抓取数据分析第55-58页
第六章 总结与展望第58-60页
参考文献第60-64页
研究成果及发表的学术论文第64-66页
致谢第66-68页
作者与导师简介第68-69页
北京化工大学硕士研究生学位论文答辩委员会决议书第69-70页

论文共70页,点击 下载论文
上一篇:基于双路索引的XML查询优化研究
下一篇:Deep Web数据源的发现与聚类研究