首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Nutch的搜索引擎系统的研究与实现

摘要第1-5页
ABSTRACT第5-7页
目录第7-9页
第一章 绪论第9-15页
   ·研究背景与意义第9-11页
   ·搜索引擎研究现状第11-13页
     ·搜索引擎开源项目第11-12页
     ·搜索引擎技术发展方向第12-13页
   ·本文的主要研究内容第13页
   ·本文的组织结构第13-15页
第二章 搜索引擎相关技术第15-33页
   ·搜索引擎的基本技术与体系结构第15-22页
     ·数据抓取第15-18页
     ·数据索引处理第18-21页
     ·数据查询服务第21-22页
   ·中文分词技术第22-25页
     ·中文分词技术概述第22-23页
     ·基本分词算法分类第23-25页
   ·Hadoop分布式平台第25-30页
     ·HDFS基础架构第25-27页
     ·MapReduce基本结构第27-30页
   ·搜索引擎评价指标体系第30-32页
     ·评价指标体系第30-31页
     ·其他评测因素第31-32页
   ·本章小结第32-33页
第三章 基于NUTCH的搜索引擎系统的研究与设计第33-51页
   ·系统体系结构第33-34页
   ·改进后的系统详细设计第34-47页
     ·Nutch数据采集过程第37-41页
     ·Nutch数据索引过程第41-46页
     ·Nutch数据查询过程第46-47页
   ·系统用例模型第47-48页
   ·系统工作时序第48-50页
   ·本章小结第50-51页
第四章 基于NUTCH的搜索引擎系统的具体实现第51-70页
   ·加入中文分词模块第51-56页
     ·Nutch中的中文分词第51-52页
     ·Nutch中添加Paoding分词第52-53页
     ·实验过程第53-56页
   ·基于NUTCH的分布式搜索集群的实现第56-66页
   ·集群监控系统GANGLIA的实现第66-69页
   ·本章小结第69-70页
第五章 全文总结与研究展望第70-72页
   ·全文总结第70页
   ·进一步的研究与展望第70-72页
参考文献第72-74页
致谢第74-75页
作者攻读学位期间发表的学术论文第75页

论文共75页,点击 下载论文
上一篇:远程协议测试系统的研究与实现
下一篇:基于AC系数统计模型的多种JPEG图像真实性检测技术研究