基于MapReduce的全文索引模块的设计与实现

摘要	第1-4页
Abstract	第4-10页
第1章绪论	第10-13页
·课题背景	第10-11页
·课题内容	第11-12页
·论文结构	第12页
·本章小结	第12-13页
第2章 MapReduce分布式计算框架基础与分析及非结构化数据管理系统简介	第13-29页
·分布式计算简介	第13-14页
·分布式文件系统	第14-18页
·HDFS系统架构	第15-16页
·HDFS数据块大小	第16页
·HDFS数据副本	第16-18页
·数据副本的放置原则和选择原则	第17-18页
·HDFS容错与诊断	第18页
·文件系统元数据的持久化	第18页
·数据块副本备份	第18页
·数据完整性	第18页
·MapReduce分布式计算框架	第18-25页
·MapReduce程序执行过程剖析	第19-22页
·Job提交	第19-20页
·Job初始化	第20-21页
·任务指派	第21页
·任务的执行	第21页
·Job完成	第21-22页
·Job Input和Job Output	第22页
·Job Input-Input Format	第22页
·Job Output-Output Format	第22页
·Shuffle和Sort	第22-24页
·Map端处理	第23页
·Reduce端处理	第23-24页
·局部性原则	第24页
·容错	第24-25页
·Map或Reduce任务错误	第24页
·TaskTracker错误	第24-25页
·JobTracker错误	第25页
·非结构化数据管理系统整体设计	第25-28页
·系统架构	第25-26页
·系统主要功能模块	第26-28页
·底层集群系统	第26页
·高可用性海量数据存储模块	第26-27页
·可插拔式存储引擎	第27页
·统一数据搜索引擎	第27-28页
·信息抽取模块	第28页
·基础服务组件	第28页
·本章小结	第28-29页
第3章全文索引程序模块详细设计与实现	第29-39页
·全文索引程序模块整体处理流程	第29-30页
·索引建立	第30-37页
·MapReduce程序输入划分	第30-32页
·Map程序设计	第32-34页
·Reduce程序设计	第34页
·OutputFormat设计	第34-36页
·Job提交	第36-37页
·索引查询	第37-38页
·索引合并	第38页
·本章小结	第38-39页
第4章全文索引模块的性能测试与优化	第39-56页
·全文索引模块性能基准测试	第39-43页
·测试环境	第39-40页
·基准测试	第40-43页
·MapReduce程序参数优化	第43-50页
·虚拟机重用	第43-45页
·Map与reduce空位个数配置	第45-50页
·MapReduce程序计算粒度优化	第50-54页
·本章小结	第54-56页
第5章全文索引模块应用	第56-60页
·应用介绍	第56页
·应用概述	第56页
·应用目标	第56页
·应用程序设计	第56-59页
·应用程序架构图	第57页
·应用程序主要功能模块及相关流程设计	第57-59页
·本章小结	第59-60页
第6章总结与未来工作	第60-63页
·工作总结	第60页
·未来工作	第60-63页
·系统性能优化未来工作	第60-61页
·集群和MapReduce程序监控	第61页
·对于Hadoop的改进	第61-62页
·分布式索引	第62-63页
参考文献	第63-65页
攻读硕士学位期间主要的研究成果	第65-66页
致谢	第66页