摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第11-19页 |
1.1 研究背景 | 第11-12页 |
1.2 研究意义 | 第12-14页 |
1.3 国内外现状 | 第14-17页 |
1.3.1 国内外云存储现状 | 第14页 |
1.3.2 云计算在教育领域的研究现状 | 第14-15页 |
1.3.3 小文件研究现状 | 第15-17页 |
1.4 主要研究内容与论文结构 | 第17-19页 |
第二章 Hadoop平台关键技术介绍 | 第19-33页 |
2.1 HDFS系统架构及特征 | 第19-22页 |
2.1.1 HDFS系统架构 | 第19-21页 |
2.1.2 HDFS系统特征 | 第21-22页 |
2.2 HDFS的数据交互 | 第22-24页 |
2.3 HDFS通信协议 | 第24-25页 |
2.4 HDFS关键数据结构 | 第25-29页 |
2.5 HDFS的存储策略 | 第29-30页 |
2.5.1 HDFS副本存放策略 | 第29-30页 |
2.5.2 HDFS的元数据存储策略 | 第30页 |
2.6 HDFS小文件性能分析 | 第30-31页 |
2.7 本章小结 | 第31-33页 |
第三章 小文件存储方案的分析与优化设计 | 第33-52页 |
3.1 Hadoop提供的小文件解决方案 | 第33-36页 |
3.1.1 文件归档技术HAR | 第33-34页 |
3.1.2 序列化文件技术 | 第34-35页 |
3.1.3 CombineFileInputFormat | 第35页 |
3.1.4 HDFS小文件解决方案总结 | 第35-36页 |
3.2 系统总体设计 | 第36-38页 |
3.3 小文件存储优化方案设计 | 第38-46页 |
3.3.1 体系结构设计 | 第38-41页 |
3.3.2 小文件的合并设计 | 第41-44页 |
3.3.3 小文件的检索设计 | 第44-45页 |
3.3.4 小文件的预取与缓存设计 | 第45-46页 |
3.4 碎片整理机制 | 第46页 |
3.5 小文件存储优化算法设计 | 第46-51页 |
3.5.1 相关类介绍 | 第47-48页 |
3.5.2 合并算法设计 | 第48-49页 |
3.5.3 索引结构设计 | 第49-51页 |
3.6 小文件优化方案的分析 | 第51页 |
3.7 本章小结 | 第51-52页 |
第四章 小文件优化方案的实现 | 第52-63页 |
4.1 总体架构实现 | 第52-53页 |
4.2 小文件的预处理 | 第53-59页 |
4.2.1 分词与去停用词 | 第53-54页 |
4.2.2 特征选择 | 第54-56页 |
4.2.3 特征权重计算 | 第56-57页 |
4.2.4 文本分类关联 | 第57-59页 |
4.3 小文件的合并实现 | 第59-60页 |
4.4 小文件的索引实现 | 第60-62页 |
4.5 本章小结 | 第62-63页 |
第五章 实验与数据分析 | 第63-73页 |
5.1 实验目的 | 第63页 |
5.2 实验环境搭建 | 第63-67页 |
5.2.1 实验配置 | 第64页 |
5.2.2 平台及环境搭建 | 第64-66页 |
5.2.3 实验用到的JAVA类 | 第66-67页 |
5.3 实验结果对比分析 | 第67-72页 |
5.3.1 文件上传分析 | 第68-69页 |
5.3.2 NameNode内存使用情况对比 | 第69-70页 |
5.3.3 文件随机访问实验 | 第70-72页 |
5.4 本章小结 | 第72-73页 |
第六章 总结与展望 | 第73-75页 |
6.1 总结 | 第73-74页 |
6.2 展望 | 第74-75页 |
致谢 | 第75-76页 |
参考文献 | 第76-80页 |
攻硕期间取得的研究成果 | 第80-81页 |