Hadoop集群实时性能监控及I/O性能优化研究

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第12-18页
1.1 研究背景和意义	第12-14页
1.2 国内外研究现状	第14-16页
1.3 本文的研究内容	第16-17页
1.4 本文的章节安排	第17-18页
第2章 Hadoop简介	第18-33页
2.1 Hadoop概述	第18-19页
2.2 Hadoop体系结构	第19-25页
2.2.1 HDFS	第19-22页
2.2.2 MapReduce	第22-25页
2.3 Hadoop分布式基本原理	第25-27页
2.3.1 容错性	第26页
2.3.2 本地计算	第26页
2.3.3 任务粒度	第26-27页
2.3.4 备用任务	第27页
2.4 HadoopI/O代价分析	第27-32页
2.4.1 map阶段	第27-29页
2.4.2 reduce阶段	第29-32页
2.5 本章小结	第32-33页
第3章 Hadoop实时性能监控系统	第33-44页
3.1 Hadoop集群监控需求	第33-34页
3.2 三个功能模块	第34-37页
3.2.1 数据收集——Ganglia	第34-35页
3.2.2 警告报警——Nagios	第35页
3.2.3 数据存储——MongoDB	第35-36页
3.2.4 Hadoop实时性能监控模型	第36-37页
3.3 实现过程	第37-42页
3.3.1 Ganglia和Nagios的集成	第37-40页
3.3.2 监控系统数据的存储	第40-42页
3.4 本章小结	第42-44页
第4章 Hadoop Join算法的评估与改进	第44-61页
4.1 三种Hadoop Join算法	第44-51页
4.1.1 Reduce Join	第44-46页
4.1.2 Map Join	第46-48页
4.1.3 Semi Join	第48-51页
4.2 实验环境	第51页
4.3 结果分析	第51-53页
4.4 改进的Hadoop Join算法	第53-57页
4.4.1 算法实现	第54-55页
4.4.2 算法的I/O成本分析	第55-57页
4.5 算法评估	第57-59页
4.5.1 Reduce Join	第57-58页
4.5.2 Semi Join	第58页
4.5.3 Map Join	第58-59页
4.5.4 改进后的Hadoop Join算法	第59页
4.6 本章小结	第59-61页
总结与展望	第61-63页
参考文献	第63-66页
附录 A(攻读学位期间所发表的学术论文目录)	第66-67页
致谢	第67-68页