海量动漫资源中小文件存储技术研究与应用

摘要	第5-6页
Abstract	第6页
第1章绪论	第10-14页
1.1 选题背景与意义	第10-11页
1.2 国内外研究现状	第11-12页
1.3 研究内容	第12-13页
1.4 论文组织结构	第13-14页
第2章相关技术	第14-28页
2.1 Hadoop框架结构	第14-16页
2.1.1 Hadoop原理和特点	第14-16页
2.2 HDFS结构	第16-20页
2.2.1 HDFS体系结构	第16-17页
2.2.2 HDFS系统架构流程	第17-20页
2.3 Hadoop集群下HDFS小文件处理技术	第20-22页
2.3.1 小文件定义及其来源	第20-21页
2.3.2 Hadoop集群下海量小文件处理问题分析	第21页
2.3.3 Hadoop集群下海量小文件解决方案分析	第21-22页
2.4 Hadoop集群下海量小文件现有解决方案分析	第22-23页
2.5 Hive数据仓库	第23-26页
2.5.1 Hive表的类型	第24页
2.5.2 Hive与传统数据库对比	第24-25页
2.5.3 Hive与HBase对比	第25-26页
2.5.4 Hive中数据的导入方式	第26页
2.6 本章小结	第26-28页
第3章基于HDFS的海量小文件优化存储方案	第28-46页
3.1 存储方案设计思路	第28-31页
3.1.1 架构设计	第28-29页
3.1.2 存储方案设计	第29-30页
3.1.3 方案的可行性分析	第30页
3.1.4 实现方案需要解决的关键问题	第30-31页
3.2 海量小文件关联性分析	第31-35页
3.2.1 小文件关联性设计	第31-32页
3.2.2 建立数据库信息特征集合	第32-33页
3.2.3 小文件与特征库关联提取	第33-34页
3.2.4 小文件与特征库相似度计算	第34-35页
3.3 海量小文件合并	第35-36页
3.3.1 小文件合并方法	第35页
3.3.2 小文件合并算法	第35-36页
3.4 小文件索引设计	第36-44页
3.4.1 线性哈希索引步骤	第37-38页
3.4.2 线性哈希索引的主要过程	第38页
3.4.3 索引的设计	第38-41页
3.4.4 小文件映射结构	第41-42页
3.4.5 小文件映射表	第42-43页
3.4.6 文件上传功能	第43-44页
3.5 本章小结	第44-46页
第4章 Hadoop环境下海量动漫小文件存储系统的设计与实现	第46-60页
4.1 需求分析与整体设计	第46-48页
4.2 详细设计	第48-53页
4.2.1 动漫素材库前台及后台设计	第48-49页
4.2.2 优化的海量素材存储模块	第49-50页
4.2.3 动漫素材库文件合并模块	第50-52页
4.2.4 系统UML类图	第52-53页
4.3 系统实现	第53-59页
4.3.1 海量文件索引模块实现	第53-57页
4.3.2 海量文件查询的web实现	第57-58页
4.3.3 海量文件素材上传功能实现	第58-59页
4.3.4 海量文件素材文件下载功能实现	第59页
4.4 本章小结	第59-60页
第5章性能分析与评价	第60-66页
5.1 实验数据来源	第60-61页
5.2 实验平台的搭建	第61-62页
5.2.1 硬件环境	第62页
5.2.2 软件环境	第62页
5.3 实验结果综合性能分析对比	第62-65页
5.3.1 写入小文件的平均时间	第63-64页
5.3.2 改进前后NameNode节点内存消耗比	第64页
5.3.3 读取动漫素材小文件的平均时间	第64-65页
5.4 本章小结	第65-66页
第6章总结和展望	第66-68页
6.1 总结	第66页
6.2 展望	第66-68页
参考文献	第68-72页
致谢	第72-74页
攻读硕士学位期间的论文项目情况	第74页