支持Ajax技术的Deep Web网络爬虫模型研究

摘要	第1-6页
ABSTRACT	第6-11页
第1章引言	第11-17页
·课题背景及意义	第11-12页
·国内外研究现状	第12-15页
·国外研究现状	第13-14页
·国内研究现状	第14-15页
·本文研究的主要内容	第15-16页
·论文结构安排	第16-17页
第2章网络爬虫及其相关研究	第17-34页
·网络爬虫简介	第17-22页
·网络爬虫体系结构	第17-18页
·网络爬虫工作原理	第18-19页
·网络爬虫搜索策略	第19-22页
·Deep Web简介	第22-27页
·Deep Web定义	第23-24页
·Deep Web分类	第24-26页
·DeepWeb网络爬虫	第26-27页
·Ajax技术	第27-31页
·Ajax简介	第27-28页
·Ajax工作原理	第28-30页
·Ajax关键技术	第30-31页
·Ajax对传统网络爬虫的影响	第31-33页
·本章小结	第33-34页
第3章支持Ajax技术的Deep Web网络爬虫模型设计	第34-49页
·Ajax站点相关概念	第34-39页
·相关事件定义	第34-36页
·Ajax页面	第36-38页
·Ajax转换	第38-39页
·Ajax站点问题分析	第39-45页
·Ajax站点模型举例	第39-42页
·Ajax站点抓取的难点	第42-45页
·支持Ajax的Deep Web网络爬虫模型设计	第45-48页
·体系结构	第45-46页
·处理流程	第46-48页
·本章小结	第48-49页
第4章支持Ajax技术的Deep Web网络爬虫的实现	第49-68页
·基于状态仓库的Ajax爬行算法	第49-53页
·状态仓库	第49页
·基本算法描述	第49-52页
·算法存在问题	第52-53页
·优化算法	第53-59页
·JavaScript调用图	第53-55页
·优化算法描述	第55-58页
·复杂度分析	第58-59页
·AjaxFetcher组成部分实现	第59-65页
·页面状态的标识	第59页
·页面状态队列处理	第59-61页
·Ajax链接元素的识别	第61-62页
·识别状态改变	第62-63页
·DOM结构过滤	第63-64页
·状态重复检测	第64-65页
·嵌入式浏览器的使用	第65-67页
·Watij简介	第66页
·Watij应用	第66-67页
·本章小结	第67-68页
第5章实验与结果分析	第68-80页
·实验环境	第68页
·初始化设置	第68-72页
·JSpider参数设置	第70-71页
·AjaxFetcher参数设置	第71-72页
·实验结果	第72-77页
·结果分析	第77-79页
·本章小结	第79-80页
第6章总结与展望	第80-82页
·总结	第80页
·展望	第80-82页
参考文献	第82-86页
攻读学位期间公开发表论文	第86-87页
致谢	第87页