基于数据属性的大数据存储系统研究与实现

摘要	第5-6页
ABSTRACT	第6页
第一章绪论	第9-14页
1.1 研究背景	第9-10页
1.2 研究现状	第10-12页
1.3 本文主要工作内容	第12-13页
1.4 本文组织结构	第13-14页
第二章相关技术介绍	第14-27页
2.1 主流分布式文件系统概述	第14-17页
2.1.1 moose FS	第14-15页
2.1.2 mogilefs	第15-16页
2.1.3 Fast DFS	第16-17页
2.1.4 HDFS	第17页
2.2 FASTDFS文件系统概述	第17-20页
2.3 HADOOP分布式处理框架	第20-25页
2.3.1 Hadoop分布式文件系统	第20-23页
2.3.2 Map Reduce编程模型	第23-25页
2.4 MONGODB NOSQL数据库概述	第25-26页
2.5 本章小结	第26-27页
第三章需求分析和数据逻辑模型	第27-34页
3.1 系统需求分析	第27-29页
3.1.1 传统数据处理软件难以满足大数据的需求	第27页
3.1.2 对外提供统一的服务接.需求	第27-28页
3.1.3 统一的数据逻辑模型需求	第28-29页
3.2 大数据存储逻辑模型	第29-33页
3.2.1 基于属性向量的统一数据模型的提出	第29-31页
3.2.2 基于属性向量的统一数据模型的实现	第31-33页
3.3 本章小结	第33-34页
第四章系统设计和实现	第34-54页
4.1 系统总体架构	第34-35页
4.2 系统流程介绍	第35-40页
4.2.1 系统启动流程	第35-37页
4.2.2 数据文件入库	第37-38页
4.2.3 数据文件删除	第38-39页
4.2.4 数据查询和文件读取	第39-40页
4.3 文件级重复数据删除	第40-46页
4.3.1 重复数据删除技术介绍	第40-42页
4.3.2 重复数据删除在本系统中的实现	第42-46页
4.4 MONGODB分片和负载均衡算法优化	第46-49页
4.4.1 Mongo DB自分片架构	第46-47页
4.4.2 基于热度的负载均衡算法	第47-48页
4.4.3 基于热度的负载均衡算法在Mongo DB中的运用	第48-49页
4.5 系统中并行化的应用	第49-53页
4.5.1 Fast DFS中文件属性提取并行化的实现	第50-53页
4.6 本章小结	第53-54页
第五章实验测试与分析	第54-62页
5.1 实验环境部署	第54-55页
5.2 数据文件入库性能实验	第55-58页
5.3 文件入库到FASTDFS的并行属性提取和串行属性提取性能对比	第58-60页
5.4 文件查询性能测试	第60页
5.5 本章小结	第60-62页
总结与展望	第62-63页
参考文献	第63-66页
攻读硕士学位期间取得的研究成果	第66-67页
致谢	第67-68页
附件	第68页