首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式在线旅游搜索爬虫系统设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-13页
   ·研究背景及意义第9-10页
   ·网络爬虫研究现状第10-11页
   ·本文研究内容及章节安排第11-13页
     ·研究内容第11-12页
     ·章节安排第12-13页
第二章 网络爬虫相关知识第13-20页
   ·搜索引擎相关介绍第13-15页
     ·搜索引擎定义第13页
     ·搜索引擎工作原理第13-14页
     ·搜索引擎评价指标第14-15页
   ·网络爬虫相关技术和策略第15-20页
     ·网络爬虫体系结构第15-16页
     ·分布式网络爬虫类别第16-17页
     ·网络爬虫搜索策略第17-18页
     ·Robots协议第18页
     ·倒排索引第18-20页
第三章 系统关键技术分析与研究第20-27页
   ·分布式任务分配策略及粒度选择第20-21页
   ·在线旅游线路网页判别算法第21-24页
     ·在线旅游线路网页特点第21-22页
     ·网页判别算法第22-24页
   ·URL去重策略第24-27页
     ·在线旅游线路网页更新策略第25-27页
第四章 分布式在线旅游搜索爬虫系统设计第27-47页
   ·系统目标与需求分析第27-28页
     ·系统目标第27页
     ·系统需求第27-28页
   ·系统总体架构第28-29页
   ·控制服务器的设计第29-32页
   ·爬虫服务器的设计第32-41页
     ·通信模块第33-34页
     ·网络爬虫模块第34-41页
     ·数据库操作模块第41页
   ·索引检索服务器的设计第41-45页
     ·索引模块第41-44页
     ·检索模块第44-45页
   ·数据库与备份的设计第45-47页
     ·数据库第45-46页
     ·数据库备份第46-47页
第五章 分布式在线旅游搜索爬虫系统实现第47-58页
   ·控制服务器的实现第47-49页
   ·爬虫服务器的实现第49-58页
     ·通信模块的实现第50页
     ·网页下载解析模块的实现第50-54页
     ·URL管理模块的实现第54-57页
     ·数据库操作模块的实现第57-58页
第六章 分布式在线旅游搜索爬虫系统测试与分析第58-67页
   ·运行环境第58页
   ·系统运行测试第58-60页
   ·在线旅游线路网页判别算法测试第60-62页
   ·爬虫服务器测试第62-65页
   ·分布式爬虫系统网页采集测试第65-67页
总结与展望第67-68页
参考文献第68-70页
致谢第70-71页
攻读学位期间发表的学术论文目录第71页

论文共71页,点击 下载论文
上一篇:基于netfilter的企业级移动应用平台框架的研究与设计
下一篇:机器视觉技术研究与实现