面向车驾管业务的海量小文件存储研究与优化

中文摘要	第3-5页
Abstract	第5-6页
第1章绪论	第9-14页
1.1 研究背景	第9-10页
1.1.1 课题背景	第9-10页
1.1.2 HDFS存储海量小文件	第10页
1.2 国内外研究现状	第10-12页
1.3 研究内容与意义	第12页
1.4 论文的组织结构	第12-14页
第2章相关技术研究	第14-25页
2.1 HDFS概述	第14-16页
2.1.1 HDFS核心架构	第14-15页
2.1.2 HDFS关键数据结构	第15-16页
2.2 现有的海量小文件处理方案	第16-22页
2.2.1 Hadoop的通用处理方案及优缺点	第16-18页
2.2.2 基于HDFS的BlueSky海量小文件存储	第18-20页
2.2.3 FaceBook自主研发的HayStack	第20-22页
2.3 缓存替换算法	第22-24页
2.3.1 经典缓存替换算法	第22-23页
2.3.2 ZFS-ARC缓存替换算法	第23-24页
2.4 本章小结	第24-25页
第3章面向车驾管业务的海量小文件存储	第25-40页
3.1 海量小文件处理在Hadoop中存在的问题及分析	第25-27页
3.1.1 海量小文件对NameNode的内存空间占用	第25-26页
3.1.2 海量小文件访问效率问题	第26-27页
3.1.3 海量小文件在MapReduce处理中的时间消耗	第27页
3.2 VDSMSS小文件处理方案	第27-39页
3.2.1 VDSMSS中小文件的特点	第27-28页
3.2.2 VDSMSS小文件的合并及索引方法	第28-34页
3.2.2.1 单一文件访问及其索引方法	第29-31页
3.2.2.2 批量文件访问及其索引方法	第31-34页
3.2.3 VDSMSS小文件的缓存结构	第34页
3.2.4 VDSMSS小文件的删除与修改	第34-36页
3.2.5 VDSMSS小文件的读写过程	第36-39页
3.3 本章小结	第39-40页
第4章基于预读机制的自调整缓存替换算法	第40-54页
4.1 VDSMSS缓存问题	第40-41页
4.2 基于小文件关联度的预读机制	第41-45页
4.2.1 基于VDSMSS日志文件的关联规则挖掘	第41-44页
4.2.2 基于小文件关联度的预读机制	第44-45页
4.3 自调整缓存替换算法PRE-ZFSARC	第45-53页
4.3.1 PRE-ZFSARC算法过程描述	第45-50页
4.3.2 PRE-ZFSARC的自调整策略	第50-53页
4.4 本章小结	第53-54页
第5章实验与分析	第54-62页
5.1 实验目的	第54页
5.2 实验环境准备	第54-56页
5.3 实验方案与结果分析	第56-60页
5.3.1 基于小文件合并与索引的实验对比	第57-59页
5.3.2 缓存策略实验对比	第59-60页
5.4 本章小结	第60-62页
第6章总结与展望	第62-64页
6.1 总结	第62页
6.2 展望	第62-64页
参考文献	第64-68页
科研情况	第68-69页
致谢	第69-70页