基于Nutch的搜索引擎系统的研究与实现
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-7页 |
| 目录 | 第7-9页 |
| 第一章 绪论 | 第9-15页 |
| ·研究背景与意义 | 第9-11页 |
| ·搜索引擎研究现状 | 第11-13页 |
| ·搜索引擎开源项目 | 第11-12页 |
| ·搜索引擎技术发展方向 | 第12-13页 |
| ·本文的主要研究内容 | 第13页 |
| ·本文的组织结构 | 第13-15页 |
| 第二章 搜索引擎相关技术 | 第15-33页 |
| ·搜索引擎的基本技术与体系结构 | 第15-22页 |
| ·数据抓取 | 第15-18页 |
| ·数据索引处理 | 第18-21页 |
| ·数据查询服务 | 第21-22页 |
| ·中文分词技术 | 第22-25页 |
| ·中文分词技术概述 | 第22-23页 |
| ·基本分词算法分类 | 第23-25页 |
| ·Hadoop分布式平台 | 第25-30页 |
| ·HDFS基础架构 | 第25-27页 |
| ·MapReduce基本结构 | 第27-30页 |
| ·搜索引擎评价指标体系 | 第30-32页 |
| ·评价指标体系 | 第30-31页 |
| ·其他评测因素 | 第31-32页 |
| ·本章小结 | 第32-33页 |
| 第三章 基于NUTCH的搜索引擎系统的研究与设计 | 第33-51页 |
| ·系统体系结构 | 第33-34页 |
| ·改进后的系统详细设计 | 第34-47页 |
| ·Nutch数据采集过程 | 第37-41页 |
| ·Nutch数据索引过程 | 第41-46页 |
| ·Nutch数据查询过程 | 第46-47页 |
| ·系统用例模型 | 第47-48页 |
| ·系统工作时序 | 第48-50页 |
| ·本章小结 | 第50-51页 |
| 第四章 基于NUTCH的搜索引擎系统的具体实现 | 第51-70页 |
| ·加入中文分词模块 | 第51-56页 |
| ·Nutch中的中文分词 | 第51-52页 |
| ·Nutch中添加Paoding分词 | 第52-53页 |
| ·实验过程 | 第53-56页 |
| ·基于NUTCH的分布式搜索集群的实现 | 第56-66页 |
| ·集群监控系统GANGLIA的实现 | 第66-69页 |
| ·本章小结 | 第69-70页 |
| 第五章 全文总结与研究展望 | 第70-72页 |
| ·全文总结 | 第70页 |
| ·进一步的研究与展望 | 第70-72页 |
| 参考文献 | 第72-74页 |
| 致谢 | 第74-75页 |
| 作者攻读学位期间发表的学术论文 | 第75页 |