基于Nutch的搜索引擎系统的研究与实现
摘要 | 第1-5页 |
ABSTRACT | 第5-7页 |
目录 | 第7-9页 |
第一章 绪论 | 第9-15页 |
·研究背景与意义 | 第9-11页 |
·搜索引擎研究现状 | 第11-13页 |
·搜索引擎开源项目 | 第11-12页 |
·搜索引擎技术发展方向 | 第12-13页 |
·本文的主要研究内容 | 第13页 |
·本文的组织结构 | 第13-15页 |
第二章 搜索引擎相关技术 | 第15-33页 |
·搜索引擎的基本技术与体系结构 | 第15-22页 |
·数据抓取 | 第15-18页 |
·数据索引处理 | 第18-21页 |
·数据查询服务 | 第21-22页 |
·中文分词技术 | 第22-25页 |
·中文分词技术概述 | 第22-23页 |
·基本分词算法分类 | 第23-25页 |
·Hadoop分布式平台 | 第25-30页 |
·HDFS基础架构 | 第25-27页 |
·MapReduce基本结构 | 第27-30页 |
·搜索引擎评价指标体系 | 第30-32页 |
·评价指标体系 | 第30-31页 |
·其他评测因素 | 第31-32页 |
·本章小结 | 第32-33页 |
第三章 基于NUTCH的搜索引擎系统的研究与设计 | 第33-51页 |
·系统体系结构 | 第33-34页 |
·改进后的系统详细设计 | 第34-47页 |
·Nutch数据采集过程 | 第37-41页 |
·Nutch数据索引过程 | 第41-46页 |
·Nutch数据查询过程 | 第46-47页 |
·系统用例模型 | 第47-48页 |
·系统工作时序 | 第48-50页 |
·本章小结 | 第50-51页 |
第四章 基于NUTCH的搜索引擎系统的具体实现 | 第51-70页 |
·加入中文分词模块 | 第51-56页 |
·Nutch中的中文分词 | 第51-52页 |
·Nutch中添加Paoding分词 | 第52-53页 |
·实验过程 | 第53-56页 |
·基于NUTCH的分布式搜索集群的实现 | 第56-66页 |
·集群监控系统GANGLIA的实现 | 第66-69页 |
·本章小结 | 第69-70页 |
第五章 全文总结与研究展望 | 第70-72页 |
·全文总结 | 第70页 |
·进一步的研究与展望 | 第70-72页 |
参考文献 | 第72-74页 |
致谢 | 第74-75页 |
作者攻读学位期间发表的学术论文 | 第75页 |