首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

支持AJAX的互联网搜索引擎爬虫设计与实现

摘要第1-4页
Abstract第4-9页
第1章 绪论第9-15页
   ·课题背景及意义第9页
   ·搜索引擎现状第9-11页
     ·概述第9-10页
     ·分类第10-11页
     ·发展历史第11页
   ·搜索引擎的原理第11-14页
     ·搜集器第12页
     ·分析器第12-13页
     ·索引器第13页
     ·检索器第13-14页
     ·用户接口第14页
   ·论文组织第14-15页
第2章 网络爬虫研究热点第15-22页
   ·网络爬虫第15-17页
     ·基本原理第15页
     ·工作流程第15-16页
     ·网页抓取策略第16-17页
   ·聚焦爬虫第17-20页
     ·体系结构第18-20页
   ·主题爬虫第20-21页
     ·系统组成第20-21页
   ·本章小结第21-22页
第3章 AjaxCrawler概要设计第22-33页
   ·Web 2.0的影响第22-29页
     ·概述第23页
     ·AJAX第23-29页
   ·AjaxCrawler总体结构第29-31页
   ·AjaxCrawler关键技术第31-32页
     ·JavaScript的解析第31-32页
     ·DOM操作的解析第32页
   ·本章小结第32-33页
第4章 AjaxCrawler的实现第33-49页
   ·相关技术第33-37页
     ·HTTP协议第33-34页
     ·起始地址的选择第34页
     ·漫游空间的划分第34-35页
     ·爬虫的控制原则第35-36页
     ·内容提取第36-37页
   ·网页抓取模块第37-41页
     ·实现第37-41页
   ·网页分析模块第41-42页
     ·嵌入JavaScript第41-42页
     ·网页分析流程第42页
   ·JS解析模块第42-45页
     ·JavaScript简介第42-43页
     ·关键算法第43-45页
   ·DOM支持模块第45-47页
     ·HTML DOM简介第45-46页
     ·关键技术第46-47页
   ·页面生成模块第47-48页
     ·提取超链接第48页
   ·本章小结第48-49页
第5章 测试和实验第49-56页
   ·测试第49页
   ·实验第49-54页
     ·AJAX网站的测试第49-52页
     ·非AJAX网站的测试第52-54页
   ·结论第54-56页
第6章 总结和展望第56-58页
   ·总结第56页
   ·不足与展望第56-58页
参考文献第58-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:应用于电子政务的即时通讯系统研究和设计
下一篇:基于分布式系统的程序监控技术研究及其应用