首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Nutch的分布式搜索引擎的研究与优化

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-14页
   ·研究背景及意义第10-11页
   ·研究现状第11-12页
     ·Hadoop研究现状第11页
     ·搜索引擎的研究现状第11-12页
   ·研究目标和内容第12-13页
   ·论文的组织结构第13-14页
第2章 Nutch框架和Hadoop分布式平台第14-28页
   ·Nutch概述第14页
   ·Nutch工作原理第14-20页
     ·Nutch工作流程第15-19页
     ·Nutch的插件机制第19-20页
   ·Nutch中的中文分词模块第20-21页
   ·Hadoop分布式计算平台第21-25页
     ·Hadoop概述第21-22页
     ·HDFS分布式文件系统第22-24页
     ·Map/Reduce编程模型第24-25页
   ·索引技术第25-27页
     ·索引概述第25-26页
     ·倒排索引第26-27页
   ·本章小结第27-28页
第3章 分布式爬虫研究第28-45页
   ·网络爬虫原理第28-29页
   ·分布式爬虫的结构分析第29-30页
   ·爬虫抓取信息策略第30-32页
   ·经典爬虫算法第32-34页
   ·提高抓取性能的技术第34-35页
   ·任务分配算法第35-42页
     ·动态哈希映射模式第35-36页
     ·一级哈希映射算法第36-37页
     ·二级哈希映射算法第37-38页
     ·可扩展的哈希映射算法第38-42页
   ·Lucence技术第42-44页
     ·Lucene的系统结构第42-44页
     ·Lucene应用于日志搜索第44页
   ·本章小结第44-45页
第4章 分布式搜索系统的设计第45-58页
   ·分布式搜索引擎总体结构设计第46页
   ·信息采集模块第46-48页
   ·索引模块第48-51页
     ·索引模块分析第48-49页
     ·索引模块功能第49-50页
     ·任务分配粒度第50-51页
   ·搜索模块第51-52页
   ·中文分词模块第52-57页
     ·基于Nutch的中文分词模块第52-53页
     ·对中文分词模块的改进第53-57页
   ·本章小结第57-58页
第5章 分布式搜索系统的实现和结果分析第58-74页
   ·分布式搜索系统的环境搭建第58-62页
     ·软硬件配置第58-62页
     ·系统安装说明第62页
   ·Ganglia检测系统第62-64页
     ·Ganglia系统原理第62-64页
     ·Ganglia功能第64页
   ·测试说明第64-66页
     ·测试目的第64-65页
     ·测试数据来源第65-66页
   ·实验与结果分析第66-72页
     ·搜索覆盖率测试第66-68页
     ·误搜索频率测试第68页
     ·索引更新周期的测试第68-70页
     ·系统的可靠性测试第70-72页
     ·系统实用性测试第72页
   ·本章小结第72-74页
第6章 全文总结和研究展望第74-76页
   ·总结第74页
   ·展望第74-76页
致谢第76-77页
参考文献第77-79页

论文共79页,点击 下载论文
上一篇:智能门禁系统中人脸识别技术的研究
下一篇:基于本体的上下文感知“科技论文在线”用户行为推理研究