首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

支持Ajax技术的主题网络爬虫系统研究与实现

致谢第1-6页
摘要第6-7页
ABSTRACT第7-11页
1 绪论第11-14页
   ·课题研究背景和意义第11-12页
   ·国内外研究现状第12-13页
   ·本文主要工作及组织结构第13-14页
2 相关知识介绍第14-32页
   ·网络爬虫介绍第14-19页
     ·网络爬虫分类第14-18页
     ·网络爬虫爬行策略第18-19页
     ·网络爬虫规范第19页
   ·Ajax介绍第19-23页
     ·Ajax技术介绍第19-21页
     ·网页中嵌入JavaScript的方式第21-22页
     ·Ajax对网络爬虫的影响第22-23页
   ·网页信息采集策略第23-24页
     ·协议驱动采集第23页
     ·事件驱动采集第23-24页
   ·信息抽取相关知识第24-25页
   ·相关技术介绍第25-31页
     ·正则表达式第26页
     ·DOM介绍第26-28页
     ·XPath介绍第28-29页
     ·浏览器相关知识第29-31页
   ·本章小结第31-32页
3 支持Ajax技术的主题网络爬虫系统设计第32-38页
   ·设计系统影响因素第32-35页
     ·系统功能第32页
     ·新闻站点逻辑分析第32-33页
     ·评论网页结构相似性第33-35页
     ·网页采集策略分析第35页
   ·总体结构第35-37页
     ·系统总体框架图第35-36页
     ·预处理阶段第36页
     ·实施阶段第36-37页
   ·本章小结第37-38页
4 预处理阶段第38-47页
   ·相关数据模型第38-39页
   ·有效触发元素查找流程第39-41页
   ·有效触发元素查找关键技术第41-44页
     ·Ajax状态DOM树的建立第41-42页
     ·Ajax状态有效性判定第42-44页
   ·有效触发元素规约及分类第44-45页
   ·采集规则验证第45-46页
   ·本章小结第46-47页
5 实施阶段第47-56页
   ·主题信息采集框架第47-48页
   ·协调模块第48-50页
     ·URL的管理第48-49页
     ·多线程管理第49-50页
   ·协议驱动采集第50-51页
   ·事件驱动采集模块第51-53页
   ·主题信息处理模块第53-55页
     ·主题信息抽取第53-54页
     ·数据库设计第54-55页
   ·本章小结第55-56页
6 系统验证及总结第56-65页
   ·系统验证第56-63页
     ·系统功能验证第56-61页
     ·系统效率验证第61-63页
   ·总结第63-65页
     ·论文工作总结第63-64页
     ·未来工作第64-65页
参考文献第65-67页
作者简历第67-69页
学位论文数据集第69页

论文共69页,点击 下载论文
上一篇:社区社会资本的重建--以汶川震后重建中NGO参与的社区行动为例
下一篇:中国服务贸易竞争力的影响因素研究