云环境下海量小文件存储技术的研究与应用

摘要	第4-5页
Abstract	第5-6页
Contents	第10-13页
第一章绪论	第13-19页
1.1 选题背景和意义	第13-16页
1.1.1 选题背景	第13-16页
1.1.2 研究意义	第16页
1.2 技术研究现状	第16-18页
1.3 本文结构安排	第18-19页
第二章相关技术研究综述	第19-40页
2.1 云存储	第19-22页
2.1.1 云存储的分类	第19-20页
2.1.2 云存储的技术支撑	第20-21页
2.1.3 云存储的应用	第21-22页
2.2 分布式存储系统	第22-30页
2.2.1 Amazon S3系统	第23-24页
2.2.2 淘宝TFS系统	第24-26页
2.2.3 Google GFS系统	第26-27页
2.2.4 Haystack系统	第27-30页
2.3 HADOOP平台	第30-39页
2.3.1 HDFS分布式存储	第31-34页
2.3.2 MapReduce分布式计算	第34-36页
2.3.3 Hadoop处理小文件时存在的问题	第36-39页
2.4 本章小结	第39-40页
第三章小文件处理技术研究与优化设计实现	第40-60页
3.1 HADOOP自带的解决方案	第40-43页
3.1.1 Hadoop Archive	第40-42页
3.1.2 SequenceFile	第42页
3.1.3 MapFile	第42-43页
3.1.4 HDFS Federation方案	第43页
3.2 设计方案目的和思路	第43-45页
3.2.1 设计目的	第43-45页
3.2.2 系统设计思路	第45页
3.3 优化方案设计	第45-51页
3.3.1 总体方案设计	第46-47页
3.3.2 小文件合并	第47-48页
3.3.3 小文件分解	第48-50页
3.3.4 小文件缓存	第50-51页
3.4 相关数据结构与算法	第51-56页
3.4.1 元数据类型与结构	第51-53页
3.4.2 分组算法	第53-54页
3.4.3 合并算法	第54-55页
3.4.4 分解算法	第55页
3.4.5 缓存相关信息说明	第55-56页
3.5 小文件的读写流程与接口	第56-58页
3.5.1 小文件读	第56-57页
3.5.2 小文件写	第57-58页
3.6 实现	第58-59页
3.7 本章小结	第59-60页
第四章小文件优化处理仿真及结果分析	第60-71页
4.1 HDFS原有读写过程	第60-63页
4.1.1 HDFS数据写入流程	第60-62页
4.1.2 HDFS的读出流程	第62-63页
4.2 带有小文件处理模块的HDFS读写实现过程	第63-64页
4.2.1 改进后的写入流程	第63页
4.2.2 改进后的读出流程	第63-64页
4.3 实验环境	第64-65页
4.4 仿真及分析	第65-70页
4.4.1 小文件读写时间性能测试及分析	第65-68页
4.4.2 Namenode备份元数据变化测试及分析	第68-70页
4.5 本章小结	第70-71页
总结与展望	第71-72页
参考文献	第72-76页
攻读硕士学位期间发表的论文	第76-77页
致谢	第77页