首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce的分布式搜索引擎研究

摘要第1-8页
Abstract第8-12页
第1章 绪论第12-22页
   ·课题研究背景及意义第12-13页
   ·分布式搜索引擎国内外研究现状第13-20页
     ·搜索引擎的发展历史第13-15页
     ·分布式搜索引擎的研究发展现状第15-16页
     ·MapReduce编程模型的研究发展现状第16-18页
     ·主题爬虫的研究发展现状第18-20页
   ·论文的主要研究内容和组织结构安排第20-22页
     ·论文的主要研究内容第20页
     ·论文的组织结构与安排第20-22页
第2章 分布式搜索引擎相关技术与理论知识第22-35页
   ·分布式搜索引擎的工作原理与体系结构第22-23页
     ·分布式搜索引擎的工作原理第22-23页
   ·分布式计算技术第23-29页
     ·分布式计算的工作原理第24页
     ·MapReduce编程模型第24-25页
     ·Hadoop平台简介第25-26页
     ·Hadoop分布式文件系统第26-27页
     ·Hadoop的MapReduce实现机制第27-29页
   ·网页排序算法第29-31页
     ·PageRank算法第29-30页
     ·PageRank算法存在的问题第30-31页
   ·主题爬虫技术第31-34页
     ·主题爬虫的工作原理第31-32页
     ·主题网络爬虫的结构第32-33页
     ·主题爬虫的搜索策略第33-34页
   ·本章小结第34-35页
第3章 MapReduce框架优化设计第35-51页
   ·单一控制节点所产生的问题第35-36页
   ·基于多控制节点的MapReduce框架第36-39页
     ·多NameNode环形控制结构的设计第36-37页
     ·信令系统的改进第37-38页
     ·NameNode控制节点的备份第38-39页
   ·MapReduce模型中间数据处理流程的优化第39-43页
     ·MapReduce任务分配出现的问题第40页
     ·MapReducc模型系统架构的优化第40-41页
     ·狄克逊准则与平衡策略第41-43页
     ·NMapReduce模型处理流程描述第43页
   ·实验及结果分析第43-49页
     ·实验平台第43页
     ·实验环境的安装与配置第43-46页
     ·实验方案的设计第46-48页
     ·实验结果的分析第48-49页
   ·本章小结第49-51页
第4章 PageRank算法的优化第51-61页
   ·PageRank算法的改进第51-52页
   ·基于MapReduce的PageRank算法的优化第52-58页
     ·PageRank算法优化方面的研究第53-54页
     ·基于块结构划分方法的计算流程第54-58页
   ·实验及其结果分析第58-60页
     ·实验参数的设定和数据集第58页
     ·实验方案设计第58-59页
     ·结果分析第59-60页
   ·本章小结第60-61页
第5章 基于Context Graph的主题爬虫策略优化第61-70页
   ·基于Context Graph的主题爬行策略第61-63页
     ·构建Context Graph模型第61-62页
     ·训练层次分类器阶段第62页
     ·指导爬行阶段第62-63页
   ·基于词频差异特征选取的Context Graph算法改进第63-67页
     ·基于词频差异的特征选取理论第63-66页
     ·流程的改进第66-67页
   ·实验结果与分析第67-69页
   ·本章小结第69-70页
结论与展望第70-72页
参考文献第72-77页
致谢第77-78页
附录A 攻读硕士学位期间所发表的论文第78页

论文共78页,点击 下载论文
上一篇:多元时间序列相似性搜索算法研究
下一篇:语义Web服务组合的形式化研究