| 摘要 | 第1-5页 |
| Abstract | 第5-7页 |
| 目录 | 第7-9页 |
| 第一章 绪论 | 第9-15页 |
| ·研究背景和意义 | 第9-11页 |
| ·研究现状 | 第11-13页 |
| ·数据副本放置研究现状 | 第11-12页 |
| ·小文件存储研究现状 | 第12-13页 |
| ·本文主要工作 | 第13-15页 |
| 第二章 分布式文件系统HDFS | 第15-27页 |
| ·分布式文件系统的发展 | 第15-18页 |
| ·早期阶段(1980年-1990年) | 第15-16页 |
| ·第二阶段(1995年-2000年) | 第16页 |
| ·第三阶段(2000年以后) | 第16页 |
| ·第四阶段(开源分布式文件系统) | 第16-18页 |
| ·HDFS的设计目标 | 第18页 |
| ·HDFS架构 | 第18-20页 |
| ·HDFS数据管理 | 第20-21页 |
| ·元数据 | 第20页 |
| ·数据完整性 | 第20页 |
| ·数据复制 | 第20-21页 |
| ·副本存放 | 第21页 |
| ·HDFS读写文件流程分析 | 第21-27页 |
| ·HDFS的通信原理 | 第21-22页 |
| ·读文件分析 | 第22-24页 |
| ·写文件分析 | 第24-27页 |
| 第三章 HDFS中数据块副本均衡放置策略 | 第27-37页 |
| ·在机架上随机选择Datanode的策略 | 第27-30页 |
| ·副本存储存在的问题 | 第30-31页 |
| ·多目标优化方法 | 第31页 |
| ·文件写入时Datanode的选择方法实现 | 第31-33页 |
| ·副本均衡放置实验和数据分析 | 第33-36页 |
| ·测试环境 | 第33页 |
| ·对比实验测试 | 第33页 |
| ·结果分析 | 第33-36页 |
| ·本章小结 | 第36-37页 |
| 第四章 HDFS中小文件存储改进方案 | 第37-52页 |
| ·优化小文件存储的策略 | 第37-40页 |
| ·文件的访问局部性 | 第38页 |
| ·小文件的合并 | 第38-39页 |
| ·Client端缓存 | 第39-40页 |
| ·相关数据结构与算法 | 第40-44页 |
| ·元数据类型与结构 | 第40-42页 |
| ·Client端缓存小文件的相关信息说明 | 第42页 |
| ·分组算法 | 第42-43页 |
| ·归档与解档算法 | 第43-44页 |
| ·小文件的读写流程与接口 | 第44-46页 |
| ·小文件读 | 第44-45页 |
| ·小文件写 | 第45-46页 |
| ·实现 | 第46-47页 |
| ·实验 | 第47-51页 |
| ·测试环境 | 第47页 |
| ·时间性能测试与数据分析 | 第47-50页 |
| ·Namenode备份元数据变化测试方法及结果分析 | 第50-51页 |
| ·本章小结 | 第51-52页 |
| 第五章 总结和展望 | 第52-54页 |
| ·总结 | 第52页 |
| ·展望 | 第52-54页 |
| 参考文献 | 第54-58页 |
| 致谢 | 第58页 |