基于Map/Reduce的分布式Web服务搜索引擎研究与实现

摘要	第1-6页
ABSTRACT	第6-10页
第一章绪论	第10-18页
·课题研究背景	第10-12页
·国内外研究现状	第12-14页
·课题研究意义和创新点	第14-15页
·课题支持项目	第15页
·论文章节安排	第15-18页
第二章相关概念综述	第18-28页
·Map/Reduce 技术	第18-22页
·Map/Reduce 介绍	第18-19页
·Hadoop 介绍	第19-22页
·Web 服务综述	第22-25页
·传统 Web 服务技术介绍	第22-24页
·Web API 介绍	第24-25页
·搜索引擎综述	第25-28页
第三章搜索引擎研究	第28-46页
·分布式 Web 服务搜索概述	第28-29页
·搜索引擎关键技术研究	第29-31页
·初始种子选择策略	第29-30页
·互联网信息采集	第30-31页
·URL 优先级算法研究	第31-35页
·基于网页粒度的待抓取 URL 优先级计算	第32-34页
·基于网站粒度的待抓取 URL 优先级计算	第34-35页
·基于 URL 粒度的待抓取 URL 优先级计算	第35页
·基于多粒度的待抓取 URL 优先级计算	第35页
·搜索引擎体系架构	第35-37页
·传统 Web 服务的抓取方法	第37-41页
·传统 Web 服务结构化特征	第37-38页
·主题爬虫设计	第38-39页
·WSDL 解析模块设计	第39-40页
·结合通用搜索引擎	第40-41页
·Web API 的抓取方法	第41-44页
·Web API 主页特点分析	第41-43页
·抓取模型构建	第43-44页
·搜索引擎客户端设计	第44-45页
·本章小结	第45-46页
第四章搜索引擎实现	第46-56页
·网络爬虫模块	第46-52页
·Web 服务爬虫模块的实现	第46-52页
·Web API 爬虫模块的实现	第52页
·服务端的设计	第52-53页
·索引部分	第53页
·查询客户端	第53页
·本章小结	第53-56页
第五章实验与结果分析	第56-64页
·系统配置	第56-59页
·传统 Web 服务搜索结果统计	第59-62页
·Web API 搜索结果统计	第62页
·本章小结	第62-64页
第六章总结与展望	第64-66页
·已完成工作总结	第64-65页
·下一步工作展望	第65-66页
参考文献	第66-70页
致谢	第70-72页
附录 A(攻读硕士期间学术成果)	第72-74页
附录 B(攻读硕士期间参与项目)	第74页