首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于协议驱动与事件驱动的综合聚焦爬虫研究与实现

摘要第1-10页
ABSTRACT第10-11页
第一章 引言第11-18页
   ·研究背景第11-12页
   ·国内外研究现状第12-16页
     ·网络爬虫第12页
     ·聚焦网络爬虫第12-13页
     ·Deep Web 网络爬虫第13-14页
     ·支持AJAX 的网络爬虫第14-16页
   ·本文研究内容第16-17页
   ·本文结构第17-18页
第二章 相关研究工作第18-29页
   ·搜索引擎第18-20页
     ·搜索引擎的原理第18页
     ·搜索引擎的分类第18-19页
     ·搜索引擎的发展第19-20页
   ·聚焦爬虫技术第20-26页
     ·聚焦描述第20-22页
     ·搜索策略第22-23页
     ·页面分析第23-26页
   ·AJAX 技术第26-28页
     ·AJAX 简介第26-27页
     ·AJAX 的优点第27-28页
     ·AJAX 带来的问题第28页
   ·本章小结第28-29页
第三章 多层网页关联聚焦爬行模型第29-42页
   ·相关定义与模型第29-34页
     ·事件定义第29-31页
     ·AJAX 模型第31-32页
     ·地址模型第32-34页
   ·多层网页关联聚焦爬行定义与模型第34-39页
     ·爬行路径第34-35页
     ·网页层第35-36页
     ·多层网页关联聚焦爬行模型第36-37页
     ·易扩展向量模型第37-39页
   ·多层网页关联聚焦爬行算法第39-41页
   ·本章小结第41-42页
第四章 协议驱动与事件驱动的综合第42-58页
   ·系统架构第42-43页
   ·协议驱动聚焦模块第43-46页
     ·页面获取和分析第44页
     ·网页内容分页的处理第44-45页
     ·实现多层网页关联聚焦爬行第45-46页
   ·事件驱动聚焦模块第46-52页
     ·获取AJAX 状态第46-49页
     ·网页内容分页的处理第49-50页
     ·实现多层网页关联聚焦爬行第50-52页
   ·协同模块第52-56页
     ·地址管理第52-53页
     ·实现多层网页关联聚焦爬行第53-54页
     ·线程管理第54-56页
   ·通用模块第56-57页
     ·聚焦内容抽取第56-57页
     ·URL 抽取过滤第57页
   ·本章小结第57-58页
第五章 实例测试与分析第58-74页
   ·新闻评论站点模型分析第58-63页
     ·聚焦页面分类第58页
     ·新闻站点模型第58-59页
     ·二层网页关联聚焦抓取第59-62页
     ·网页内容分页的处理第62页
     ·多站点同时爬行第62-63页
   ·测试结果与分析第63-73页
     ·可行性测试第63-65页
     ·多站点同时爬行测试第65-66页
     ·准确性测试第66-67页
     ·效率测试第67-69页
     ·对比普通聚焦爬虫第69-70页
     ·对比已有的支持AJAX 的爬虫第70-73页
   ·本章小结第73-74页
第六章 结束语第74-75页
致谢第75-76页
参考文献第76-79页
附录A 攻读硕士期间发表的论文第79-80页
附录B 攻读硕士期间参与的课题第80页

论文共80页,点击 下载论文
上一篇:ToIIS中情报信息服务描述和匹配技术研究
下一篇:三维网格的二次曲面提取技术研究