首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce的分布式搜索引擎研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-16页
   ·课题的研究背景第10页
   ·搜索引擎发展历史与研究现状第10-12页
   ·课题研究的目的和意义第12-13页
   ·本文的主要工作与文章结构第13-16页
     ·主要工作第13页
     ·文章结构第13-16页
第二章 分布式搜索引擎的相关理论和技术第16-26页
   ·搜索引擎基本功能第16页
   ·通用搜索引擎的基本原理第16-19页
     ·信息采集第17页
     ·信息预处理第17-18页
     ·用户交互第18-19页
   ·分布式计算技术与MapReduce编程模型第19-23页
     ·分布式计算的基本原理第19-20页
     ·Hadoop分布式计算平台第20-21页
     ·Hadoop中的MapReduce第21-22页
     ·HDFS分布式文件系统第22-23页
   ·分布式搜索引擎的处理流程第23-24页
   ·本章小结第24-26页
第三章 分布式搜索引擎系统设计第26-40页
   ·分布式搜索引擎设计目标第26页
   ·分布式爬虫系统设计第26-30页
     ·分布式爬虫原理第26-27页
     ·抓取模块设计第27-28页
     ·文档解析模块设计第28-29页
     ·页面评分模块设计第29-30页
   ·分布式索引系统设计第30-33页
     ·全文检索技术概述第30-31页
     ·Lucene全文索引工具包第31-33页
     ·基于Lucene的索引机制研究第33页
   ·中文分词技术第33-36页
     ·中文分词算法分析第33-34页
     ·基于最大匹配消歧的中文分词法第34-36页
   ·分布式检索模块设计第36-38页
     ·检索过程分析第36-37页
     ·Lucene检索相关类分析第37-38页
     ·分布式检索的架构第38页
   ·本章小结第38-40页
第四章 分布式搜索引擎实现第40-56页
   ·系统总体结构分析第40-42页
     ·表示URL的类第40-41页
     ·分布式搜索引擎文件结构第41-42页
   ·分布式爬虫系统实现第42-52页
     ·URL准备模块第43-46页
     ·分布式抓取模块第46-48页
     ·文档解析模块第48-49页
     ·计算反向链接模块第49-50页
     ·页面评分模块第50-52页
   ·分布式索引系统的实现第52-53页
     ·中文分词第52-53页
     ·索引生成第53页
   ·分布式检索系统的实现第53-54页
   ·本章小结第54-56页
第五章 分布式搜索引擎系统测试第56-64页
   ·实验环境建立第56-59页
     ·实验环境第56-57页
     ·安装分布式环境第57-59页
   ·系统运行情况及实验数据分析第59-62页
     ·系统运行情况第59-60页
     ·系统性能分析第60-62页
     ·系统中文分词效果第62页
   ·本章小结第62-64页
第六章 总结与展望第64-66页
   ·本文主要工作总结第64页
   ·未来工作展望第64-66页
参考文献第66-68页
致谢第68-70页
攻读学位期间发表的学术论文目录第70页

论文共70页,点击 下载论文
上一篇:基于发布/订阅系统的RFID网络研究
下一篇:RFID中间件复杂事件处理模型研究与实现