基于Hadoop的MapReduce计算模型优化与应用研究

摘要	第4-5页
Abstract	第5页
第一章绪论	第8-12页
1.1 研究背景与意义	第8-9页
1.2 研究现状	第9-10页
1.3 本论文的主要工作	第10-11页
1.4 论文结构安排	第11-12页
第二章 HADOOP 基础框架	第12-21页
2.1 HADOOP 框架	第12页
2.2 HADOOP 集群运作原理	第12-13页
2.3 MAPREDUCE 计算框架	第13-16页
2.3.1 MapReduce 作业运行流程	第13-15页
2.3.2 MapReduce 计算流程	第15-16页
2.3.3 MapReduce 按键分组和容错机制	第16页
2.4 HDFS 分布式文件系统	第16-20页
2.4.1 HDFS 架构	第16-17页
2.4.2 HDFS 文件读写流程	第17-19页
2.4.3 HDFS 可靠性措施	第19-20页
2.5 本章小结	第20-21页
第三章 MAPREDUCE 优化设计与实现	第21-36页
3.1 MAPREDUCE 性能瓶颈	第21-22页
3.2 MPI 并行技术	第22-25页
3.2.1 并行编程模型	第22-23页
3.2.2 集群算法设计	第23页
3.2.3 MPI 点对点通信	第23-25页
3.3 优化方案设计	第25-30页
3.3.1 Yarn 框架	第25-26页
3.3.2 方案设计	第26-27页
3.3.3 方案实现过程	第27-29页
3.3.4 词频统计算法	第29-30页
3.4 分布式环境部署	第30-33页
3.4.1 硬件环境部署	第30-31页
3.4.2 软件环境部署	第31-33页
3.5 实验结果与分析	第33-35页
3.6 本章小结	第35-36页
第四章 MAPREDUCE 优化模型的应用	第36-48页
4.1 平台架构设计	第36-37页
4.1.1 单点架构解决方案	第36页
4.1.2 分布式计算解决方案	第36-37页
4.2 总体方案	第37-38页
4.2.1 硬件体系结构	第37页
4.2.2 软件体系结构	第37-38页
4.3 数据计算原理	第38-40页
4.3.1 监测数据法	第38-39页
4.3.2 产排污系数法	第39-40页
4.4 系统设计与实现	第40-47页
4.4.1 Sqoop 数据传输方案	第40页
4.4.2 基于 HBase 的监测数据视图设计	第40-41页
4.4.3 性能测试与分析	第41-44页
4.4.4 系统功能模块架构	第44页
4.4.5 主要功能模块用途	第44-45页
4.4.6 系统实现	第45-47页
4.5 本章小结	第47-48页
第五章结论与展望	第48-50页
5.1 总结	第48页
5.2 展望	第48-50页
致谢	第50-51页
参考文献	第51-55页
附录 1 攻读硕士学位期间发表的论文	第55-56页
附件	第56-66页