首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce的全文索引模块的设计与实现

摘要第1-4页
Abstract第4-10页
第1章 绪论第10-13页
   ·课题背景第10-11页
   ·课题内容第11-12页
   ·论文结构第12页
   ·本章小结第12-13页
第2章 MapReduce分布式计算框架基础与分析及非结构化数据管理系统简介第13-29页
   ·分布式计算简介第13-14页
   ·分布式文件系统第14-18页
     ·HDFS系统架构第15-16页
     ·HDFS数据块大小第16页
     ·HDFS数据副本第16-18页
       ·数据副本的放置原则和选择原则第17-18页
     ·HDFS容错与诊断第18页
       ·文件系统元数据的持久化第18页
       ·数据块副本备份第18页
       ·数据完整性第18页
   ·MapReduce分布式计算框架第18-25页
     ·MapReduce程序执行过程剖析第19-22页
       ·Job提交第19-20页
       ·Job初始化第20-21页
       ·任务指派第21页
       ·任务的执行第21页
       ·Job完成第21-22页
     ·Job Input和Job Output第22页
       ·Job Input-Input Format第22页
       ·Job Output-Output Format第22页
     ·Shuffle和Sort第22-24页
       ·Map端处理第23页
       ·Reduce端处理第23-24页
     ·局部性原则第24页
     ·容错第24-25页
       ·Map或Reduce任务错误第24页
       ·TaskTracker错误第24-25页
       ·JobTracker错误第25页
   ·非结构化数据管理系统整体设计第25-28页
     ·系统架构第25-26页
     ·系统主要功能模块第26-28页
       ·底层集群系统第26页
       ·高可用性海量数据存储模块第26-27页
       ·可插拔式存储引擎第27页
       ·统一数据搜索引擎第27-28页
       ·信息抽取模块第28页
       ·基础服务组件第28页
   ·本章小结第28-29页
第3章 全文索引程序模块详细设计与实现第29-39页
   ·全文索引程序模块整体处理流程第29-30页
   ·索引建立第30-37页
     ·MapReduce程序输入划分第30-32页
     ·Map程序设计第32-34页
     ·Reduce程序设计第34页
     ·OutputFormat设计第34-36页
     ·Job提交第36-37页
   ·索引查询第37-38页
     ·索引合并第38页
   ·本章小结第38-39页
第4章 全文索引模块的性能测试与优化第39-56页
   ·全文索引模块性能基准测试第39-43页
     ·测试环境第39-40页
     ·基准测试第40-43页
   ·MapReduce程序参数优化第43-50页
     ·虚拟机重用第43-45页
     ·Map与reduce空位个数配置第45-50页
   ·MapReduce程序计算粒度优化第50-54页
   ·本章小结第54-56页
第5章 全文索引模块应用第56-60页
   ·应用介绍第56页
     ·应用概述第56页
     ·应用目标第56页
   ·应用程序设计第56-59页
     ·应用程序架构图第57页
     ·应用程序主要功能模块及相关流程设计第57-59页
   ·本章小结第59-60页
第6章 总结与未来工作第60-63页
   ·工作总结第60页
   ·未来工作第60-63页
     ·系统性能优化未来工作第60-61页
     ·集群和MapReduce程序监控第61页
     ·对于Hadoop的改进第61-62页
     ·分布式索引第62-63页
参考文献第63-65页
攻读硕士学位期间主要的研究成果第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:金融数据库系统集中式安全管理研究
下一篇:求解自动配棉问题的粒子群算法研究