基于大数据的Hadoop并行计算优化处理性能分析

摘要	第4-5页
Abstract	第5页
目录	第6-8页
专用术语注释表	第8-9页
第一章绪论	第9-12页
1.1 课题研究背景	第9-10页
1.2 国内外研究现状	第10-11页
1.3 本文的主要贡献及组织结构	第11-12页
第二章 Hadoop相关技术和平台架构	第12-23页
2.1 Hadoop简述	第12-14页
2.2 HDFS分布式文件系统	第14-15页
2.3 MapReduce模型概述	第15-22页
2.3.1 MapReduce的计算模型	第15页
2.3.2 MapReduce的工作原理	第15-20页
2.3.3 MapReduce的运行流程	第20-22页
2.4 本章小结	第22-23页
第三章 Hadoop计算模型性能调优	第23-40页
3.1 性能瓶颈分析	第23-24页
3.2 Hadoop性能评估指标	第24-25页
3.2.1 性能指标	第24页
3.2.2 实际测试指标	第24-25页
3.3 基准测试程序集	第25-27页
3.3.1 词频统计	第25-26页
3.3.2 共词对统计	第26页
3.3.3 排序	第26-27页
3.4 性能调优	第27-31页
3.4.1 应用程序角度优化	第27-28页
3.4.2 系统实现角度优化	第28-31页
3.5 Hadoop参数优化	第31-38页
3.5.1 管理员角度进行调优	第31-34页
3.5.2 用户角度进行调优	第34-38页
3.5.3 重要参数配置	第38页
3.6 本章小结	第38-40页
第四章基于代价的Hadoop性能优化模型	第40-53页
4.1 参数分析器Profiler	第40-44页
4.1.1 参数分析器Profiler设计	第41-42页
4.1.2 参数分析器Profiler使用方法	第42-44页
4.1.2.1 动态测试监控	第42-43页
4.1.2.2 原始数据监控	第43页
4.1.2.3 任务级别的采样	第43-44页
4.2 参数分析判决引擎	第44-47页
4.2.1 获得虚拟参数分析	第44-47页
4.2.1.1 评估数据流和执行时间	第45-46页
4.2.1.2 评估数据统计量	第46页
4.2.1.3 评估执行时间统计量	第46-47页
4.2.2 模拟作业执行过程	第47页
4.3 基于代价的优化模型	第47-52页
4.3.1 数学建模	第48-50页
4.3.2 枚举子空间	第50-51页
4.3.3 子空间内的搜索策略	第51-52页
4.3.3.1 网格化搜索	第51页
4.3.3.2 递归随机搜索	第51-52页
4.4 本章小结	第52-53页
第五章实验结果与数据分析	第53-68页
5.1 实验平台的搭建	第53-58页
5.1.1 集群配置方案	第53-54页
5.1.2 Hadoop安装	第54-58页
5.2 实验结果分析	第58-67页
5.2.1 实验数据与硬件配置	第58-59页
5.2.2 基于代价的优化对比经验法则	第59-61页
5.2.3 参数分析判决引擎的精确性验证	第61-63页
5.2.4 优化模型的效率与效能	第63-65页
5.2.5 参数分析采样	第65-67页
5.3 本章小结	第67-68页
第六章总结与展望	第68-69页
参考文献	第69-71页
附录 A 程序清单	第71-72页
附录 B 攻读硕士期间撰写的论文	第72-73页
附录 C 攻读硕士学位期间申请的专利	第73-74页
致谢	第74页