摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第一章 引言 | 第10-13页 |
·研究背景 | 第10-11页 |
·Hadoop发展现状 | 第10页 |
·分布式文件系统高可用性 | 第10-11页 |
·研究意义 | 第11页 |
·研究内容和论文结构 | 第11-13页 |
第二章 HADOOP文件系统架构 | 第13-18页 |
·HDFS简介 | 第13页 |
·HDFS架构分析 | 第13-18页 |
·HDFS系统架构 | 第13-14页 |
·NameNode功能 | 第14-17页 |
·NameNode元数据 | 第14-15页 |
·NameNode启动流程 | 第15-16页 |
·SafeMode状态 | 第16-17页 |
·DataNode功能 | 第17-18页 |
第三章 HADOOP高可用性问题与现有解决方案研究 | 第18-27页 |
·高可用技术研究 | 第18-20页 |
·高可用技术简介 | 第18页 |
·软件的高可用技术 | 第18-19页 |
·重启模式 | 第18-19页 |
·系统软件技术 | 第19页 |
·硬件的高可用技术 | 第19-20页 |
·冗余配置技术 | 第19-20页 |
·Hadoop高可用性问题分析 | 第20-21页 |
·Hadoop现有高可用性方案的研究 | 第21-26页 |
·冷备+手动或自动切换 | 第21-22页 |
·暖备+手动切换 | 第22页 |
·暖备+自动切换 | 第22-24页 |
·热备+手动切换 | 第24-25页 |
·热备+自动切换 | 第25-26页 |
·小结 | 第26-27页 |
第四章 HANC:HADOOP的高可用性解决方案 | 第27-60页 |
·HANC体系架构 | 第27-28页 |
·HANC的系统模块介绍 | 第28-29页 |
·数据同步模块的设计与实现 | 第29-43页 |
·数据复制 | 第29页 |
·元数据同步 | 第29-30页 |
·数据块信息同步 | 第30-34页 |
·租约管理 | 第34-35页 |
·关键的类图与方法 | 第35-43页 |
·集群管理模块的设计与实现 | 第43-50页 |
·节点状态监测 | 第43-44页 |
·Zookeeper介绍 | 第44-45页 |
·HAClusterManager进程 | 第45-46页 |
·Leader选举 | 第46-47页 |
·Split-Brain | 第47页 |
·虚拟IP地址漂移 | 第47-48页 |
·NFS宕机恢复 | 第48页 |
·关键的类图与方法 | 第48-50页 |
·客户端访问模块的设计与实现 | 第50-60页 |
·客户端的连续访问性 | 第50-52页 |
·写操作正常流程 | 第52-53页 |
·写操作故障流程 | 第53-54页 |
·读操作流程的优化 | 第54-56页 |
·关键的类图和与方法 | 第56-60页 |
第五章 实验结果 | 第60-64页 |
·实验环境 | 第60页 |
·写操作时Failover时间 | 第60-62页 |
·读操作分担到S-HANN提高吞吐量 | 第62-64页 |
第六章 总结和展望 | 第64-65页 |
·总结 | 第64页 |
·展望 | 第64-65页 |
参考文献 | 第65-68页 |
致谢 | 第68-69页 |
攻读学位期间发表的学术论文 | 第69页 |