首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

支持AJAX的定址网络爬虫系统的研究与实现

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-15页
   ·研究背景及意义第10-12页
   ·研究现状第12-13页
   ·论文研究工作第13-14页
   ·论文架构第14-15页
第二章 相关背景知识第15-25页
   ·Web2.0第15-17页
   ·JavaScript第17-18页
   ·AJAX第18-21页
     ·AJAX简介第18-19页
     ·AJAX的运作方式第19-20页
     ·AJAX与传统网页的比较第20-21页
   ·HTML DOM第21-23页
     ·DOM的树状结构第22-23页
     ·DOM常用的方法第23页
   ·XPath第23-24页
   ·本章小结第24-25页
第三章 网络爬虫系统的研究第25-32页
   ·网络爬虫第25-27页
     ·基本原理第25-26页
     ·爬行策略第26-27页
   ·AJAX爬虫的技术难点第27-31页
     ·JavaScript的解析第27-28页
     ·识别页面状态第28-29页
     ·DOM操作第29页
     ·事件触发第29-30页
     ·其他问题第30-31页
   ·本章小结第31-32页
第四章 网络爬虫系统的设计第32-42页
   ·AJAX应用实例第32-34页
   ·相关概念第34-35页
     ·页面状态与状态切换第35页
     ·clickable元素第35页
   ·AJAX建模第35-37页
     ·事件模型第35页
     ·AJAX页面模型第35-36页
     ·AJAX网站模型第36-37页
   ·系统架构第37-39页
   ·系统流程第39-41页
   ·本章小结第41-42页
第五章 爬虫系统的实现第42-62页
   ·WebKit渲染引擎第42-47页
     ·渲染引擎分析第42-44页
     ·选择Webkit的理由第44-45页
     ·WebKit框架结构第45页
     ·WebKit解析流程第45-46页
     ·Qt WebKit第46-47页
   ·链接抽取模块第47-53页
     ·过滤条件第47-50页
     ·Robots协议第50-51页
     ·URL消重策略第51-52页
     ·抽取流程第52-53页
   ·脚本生成模块第53-57页
     ·样本页面第53-54页
     ·关键参数设置第54-55页
     ·定位clickable元素第55-56页
     ·脚本执行逻辑第56-57页
   ·Cookie管理模块第57-58页
   ·模块交互与关键算法第58-60页
   ·系统实现第60-61页
   ·本章小结第61-62页
第六章 爬虫系统实验与结果分析第62-68页
   ·实验环境第62页
   ·评估方法第62-63页
   ·实验设计及结果分析第63-67页
     ·查全率第63-64页
     ·准确度第64-65页
     ·抓取速率第65-67页
   ·本章小结第67-68页
第七章 结束语第68-70页
   ·结论第68-69页
   ·未来方向第69-70页
参考文献第70-72页
致谢第72-73页
攻读学位期间发表的学术论文第73页

论文共73页,点击 下载论文
上一篇:基于Android平台的企业信息化管理系统客户端软件的研究与实现
下一篇:基于PAAS平台的敏捷商业智能集成开发环境的研究与实现