制造业大数据分布式存储管理方法研究
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
1 引言 | 第9-15页 |
1.1 研究背景 | 第9-10页 |
1.2 研究现状 | 第10-12页 |
1.2.1 工业大数据管理研究现状 | 第10-11页 |
1.2.2 分布式存储方案研究现状 | 第11-12页 |
1.3 研究内容 | 第12-14页 |
1.4 本文组织结构 | 第14-15页 |
2 相关工作 | 第15-25页 |
2.1 对象代理数据模型 | 第15-18页 |
2.1.1 基本概念 | 第15-16页 |
2.1.2 代理类型 | 第16页 |
2.1.3 对象代理数据库系统 | 第16-18页 |
2.2 HDFS分布式文件系统 | 第18-21页 |
2.2.1 HDFS系统架构 | 第18-20页 |
2.2.2 HDFS文件存储流程 | 第20-21页 |
2.2.3 HDFS副本管理 | 第21页 |
2.3 AsterixDB大数据管理系统 | 第21-24页 |
2.3.1 AsterixDB系统架构 | 第21-22页 |
2.3.2 ADM数据模型 | 第22-23页 |
2.3.3 基于LSM-tree的数据存储与索引 | 第23-24页 |
2.4 本章小结 | 第24-25页 |
3 制造业大数据分布式存储引擎架构设计 | 第25-32页 |
3.1 制造业大数据现有存储方案的不足 | 第25页 |
3.2 存储系统设计目标 | 第25-26页 |
3.3 存储系统架构及功能介绍 | 第26-31页 |
3.3.1 客户端 | 第28页 |
3.3.2 存储管理模块 | 第28-30页 |
3.3.3 对象代理数据库系统 | 第30页 |
3.3.4 HDFS集群 | 第30-31页 |
3.4 本章小结 | 第31-32页 |
4 制造业大数据的分布式存储方案 | 第32-55页 |
4.1 元数据存储管理方法 | 第32-38页 |
4.1.1 制造业非结构化数据的元数据类型 | 第32-34页 |
4.1.2 元数据建模方法 | 第34-35页 |
4.1.3 关联关系建模方法 | 第35-38页 |
4.2 小文件存储优化策略 | 第38-47页 |
4.2.1 现有小文件存储优化方案 | 第39-40页 |
4.2.2 小文件合并存储原理 | 第40-42页 |
4.2.3 基于关联的小文件聚簇方法 | 第42-47页 |
4.2.4 小文件操作过程 | 第47页 |
4.3 动态副本管理方法 | 第47-54页 |
4.3.1 现有副本管理方法 | 第48-49页 |
4.3.2 副本调整量预测 | 第49-51页 |
4.3.3 动态副本调整策略 | 第51-54页 |
4.4 本章小结 | 第54-55页 |
5 方案测试 | 第55-62页 |
5.1 实验设计 | 第55-57页 |
5.1.1 实验数据 | 第55页 |
5.1.2 实验方法 | 第55-56页 |
5.1.3 实验环境 | 第56-57页 |
5.2 功能实现 | 第57-58页 |
5.3 性能对比 | 第58-61页 |
5.3.1 小文件合并性能对比 | 第58-60页 |
5.3.2 动态副本策略性能对比 | 第60-61页 |
5.4 本章小结 | 第61-62页 |
6 总结与展望 | 第62-65页 |
6.1 论文总结 | 第62-63页 |
6.2 未来工作 | 第63-65页 |
参考文献 | 第65-69页 |
附录 | 第69-71页 |
致谢 | 第71-72页 |