首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

支持Ajax技术的Deep Web网络爬虫模型研究

摘要第1-6页
ABSTRACT第6-11页
第1章 引言第11-17页
   ·课题背景及意义第11-12页
   ·国内外研究现状第12-15页
     ·国外研究现状第13-14页
     ·国内研究现状第14-15页
   ·本文研究的主要内容第15-16页
   ·论文结构安排第16-17页
第2章 网络爬虫及其相关研究第17-34页
   ·网络爬虫简介第17-22页
     ·网络爬虫体系结构第17-18页
     ·网络爬虫工作原理第18-19页
     ·网络爬虫搜索策略第19-22页
   ·Deep Web简介第22-27页
     ·Deep Web定义第23-24页
     ·Deep Web分类第24-26页
     ·DeepWeb网络爬虫第26-27页
   ·Ajax技术第27-31页
     ·Ajax简介第27-28页
     ·Ajax工作原理第28-30页
     ·Ajax关键技术第30-31页
   ·Ajax对传统网络爬虫的影响第31-33页
   ·本章小结第33-34页
第3章 支持Ajax技术的Deep Web网络爬虫模型设计第34-49页
   ·Ajax站点相关概念第34-39页
     ·相关事件定义第34-36页
     ·Ajax页面第36-38页
     ·Ajax转换第38-39页
   ·Ajax站点问题分析第39-45页
     ·Ajax站点模型举例第39-42页
     ·Ajax站点抓取的难点第42-45页
   ·支持Ajax的Deep Web网络爬虫模型设计第45-48页
     ·体系结构第45-46页
     ·处理流程第46-48页
   ·本章小结第48-49页
第4章 支持Ajax技术的Deep Web网络爬虫的实现第49-68页
   ·基于状态仓库的Ajax爬行算法第49-53页
     ·状态仓库第49页
     ·基本算法描述第49-52页
     ·算法存在问题第52-53页
   ·优化算法第53-59页
     ·JavaScript调用图第53-55页
     ·优化算法描述第55-58页
     ·复杂度分析第58-59页
   ·AjaxFetcher组成部分实现第59-65页
     ·页面状态的标识第59页
     ·页面状态队列处理第59-61页
     ·Ajax链接元素的识别第61-62页
     ·识别状态改变第62-63页
     ·DOM结构过滤第63-64页
     ·状态重复检测第64-65页
   ·嵌入式浏览器的使用第65-67页
     ·Watij简介第66页
     ·Watij应用第66-67页
   ·本章小结第67-68页
第5章 实验与结果分析第68-80页
   ·实验环境第68页
   ·初始化设置第68-72页
     ·JSpider参数设置第70-71页
     ·AjaxFetcher参数设置第71-72页
   ·实验结果第72-77页
   ·结果分析第77-79页
   ·本章小结第79-80页
第6章 总结与展望第80-82页
   ·总结第80页
   ·展望第80-82页
参考文献第82-86页
攻读学位期间公开发表论文第86-87页
致谢第87页

论文共87页,点击 下载论文
上一篇:基于Crawler的Web服务搜索研究
下一篇:基于用户浏览行为的网络资源排序研究