大数据环境下Hadoop平台性能优化研究

摘要	第6-7页
Abstract	第7页
第1章绪论	第10-14页
1.1 研究课题的背景和意义	第10-11页
1.2 国内外发展概况	第11-12页
1.3 主要内容及论文结构	第12-13页
1.4 本章小结	第13-14页
第2章 Hadoop运行原理研究	第14-28页
2.1 Hadoop简介	第14-17页
2.2 HDFS简介	第17-24页
2.2.1 Namenode主要功能	第18-19页
2.2.2 Namenode启动过程	第19-21页
2.2.3 HDFS读写数据过程	第21-24页
2.3 MapReduce简介	第24-27页
2.3.1 MapReduce概述	第24-25页
2.3.2 MapReduce工作原理	第25-27页
2.4 Hadoop性能优化研究	第27页
2.5 本章小结	第27-28页
第3章 HDFS单点失效问题解决方案	第28-39页
3.1 HDFS单点失效原因分析	第28-29页
3.1.1 可靠性	第28-29页
3.1.2 可维护性	第29页
3.2 相关研究	第29-31页
3.2.1 Secondery Namenode机制	第29-30页
3.2.2 Backup Namenode机制	第30-31页
3.3 Avatar Node方案	第31-33页
3.4 改进的Avatar Node方案	第33-36页
3.4.1 设计思想	第33-34页
3.4.2 方案实现过程	第34-36页
3.5 改进的Avatar Node方案测试结果与分析	第36-38页
3.5.1 自动切换测试	第37页
3.5.2 二次故障测试	第37-38页
3.5.3 数据完整性测试	第38页
3.6 本章小结	第38-39页
第4章 MapReduce中连接算法优化研究	第39-54页
4.1 连接算法	第39-40页
4.1.1 Map端连接	第39-40页
4.1.2 Reduce端连接	第40页
4.2 基于MapReduce的多表连接	第40-43页
4.3 基于计数型Bloom过滤器的星型连接算法	第43-49页
4.3.1 Bloom过滤器	第43-44页
4.3.2 基于计数型Bloom过滤器的星型连接算法	第44-49页
4.4 实验结果分析	第49-53页
4.4.1 实验环境及数据	第49页
4.4.2 算法时间与空间性能测试	第49-52页
4.4.3 算法可扩展性	第52-53页
4.5 本章小结	第53-54页
总结与展望	第54-56页
致谢	第56-57页
参考文献	第57-61页
作者简介及学习情况	第61-62页
攻读硕士学位期间发表的论文和科研成果	第62-63页