摘要 | 第4-5页 |
ABSTRACT | 第5页 |
目录 | 第6-8页 |
第一章 绪论 | 第8-15页 |
1.1 论文课题研究背景 | 第8-9页 |
1.2 论文课题研究内容 | 第9-12页 |
1.3 论文课题研究目的 | 第12-13页 |
1.4 论文结构安排 | 第13-15页 |
第二章 HADOOP集群的搭建 | 第15-48页 |
2.1 APACHE HADOOP的初略介绍 | 第15-22页 |
2.1.1 Hadoop软件生态系统 | 第15-19页 |
2.1.2 Hadoop发行版本 | 第19-22页 |
2.2 简单HADOOP集群的搭建 | 第22-33页 |
2.2.1 集群部署介绍 | 第22-24页 |
2.2.2 SSH无密码验证配置 | 第24-27页 |
2.2.3 Java环境安装 | 第27-28页 |
2.2.4 Hadoop集群安装 | 第28-33页 |
2.3 HADOOP中加载HBASE等模块 | 第33-40页 |
2.3.1 加载HBase模块 | 第33-36页 |
2.3.2 加载Hive模块 | 第36-37页 |
2.3.3 加载ZooKeeper模块 | 第37-40页 |
2.4 HADOOP集群搭建与运行过程中的常见问题以及解决方案 | 第40-48页 |
2.4.1 Hadoop常见错误以及解决方案 | 第40-44页 |
2.4.2 HBase常见错误以及解决方案 | 第44-46页 |
2.4.3 ZooKeeper常见错误以及解决方案 | 第46-48页 |
第三章 HADOOP分布式文件系统的深入分析 | 第48-55页 |
3.1 HDFS数据块 | 第48-49页 |
3.1.1 数据块的概念 | 第48-49页 |
3.1.2 数据块大小与Map任务分片大小的关系 | 第49页 |
3.2 HDFS主要流程 | 第49-55页 |
3.2.1 客户端到名字节点的文件与目录操作 | 第49-51页 |
3.2.2 客户端读文件 | 第51-52页 |
3.2.3 客户端写文件 | 第52-53页 |
3.2.4 数据节点的启动与心跳 | 第53-55页 |
第四章 HADOOP HDFS实际使用改良研究与测试 | 第55-72页 |
4.1 分布式文件系统简介 | 第55-57页 |
4.1.1 分布式文件系统的概念 | 第55页 |
4.1.2 分布式文件系统的特性 | 第55-56页 |
4.1.3 分布式文件系统与本地文件系统的对比 | 第56-57页 |
4.2 主流分布式文件系统的比较 | 第57-60页 |
4.2.1 Lustre文件系统 | 第57-58页 |
4.2.2 GFS文件系统 | 第58-59页 |
4.2.3 GPFS文件系统 | 第59-60页 |
4.3 基于HDFS实用改良的理论探究 | 第60-71页 |
4.3.1 分布式文件系统的设计 | 第60-64页 |
4.3.2 分布式文件系统HDFS的改良思路 | 第64-67页 |
4.3.3 分布式文件系统HDFS改良测试 | 第67-71页 |
4.4 小结 | 第71-72页 |
第五章 总结 | 第72-74页 |
5.1 论文工作内容总结 | 第72-73页 |
5.2 问题和展望 | 第73-74页 |
参考文献 | 第74-76页 |
致谢 | 第76页 |