分布式存储中数据压缩研究与实现
摘要 | 第5-6页 |
abstract | 第6页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景和意义 | 第10-11页 |
1.2 国内外研究现状 | 第11页 |
1.3 本文的主要研究工作 | 第11-12页 |
1.4 论文结构 | 第12-14页 |
第二章 相关技术综述 | 第14-26页 |
2.1 分布式存储理论 | 第14页 |
2.2 MooseFS分布式文件系统概述 | 第14-19页 |
2.2.1 体系架构 | 第14-16页 |
2.2.2 业务读写流程 | 第16-19页 |
2.3 用户级文件系统FUSE概述 | 第19-22页 |
2.3.1 VFS原理介绍 | 第19-20页 |
2.3.2 FUSE原理介绍 | 第20-22页 |
2.4 数据压缩概述 | 第22-25页 |
2.4.1 数据压缩理论 | 第22-23页 |
2.4.2 数据压缩算法原理介绍 | 第23-25页 |
2.5 本章小结 | 第25-26页 |
第三章 分布式存储中数据压缩方案的研究与设计 | 第26-49页 |
3.1 需求分析 | 第26页 |
3.2 现有压缩方案研究与分析 | 第26-30页 |
3.2.1 纠删码技术 | 第26-28页 |
3.2.2 重复数据删除技术 | 第28-30页 |
3.3 现有压缩算法研究与改进 | 第30-36页 |
3.3.1 现有压缩算法对比分析与选择 | 第31-32页 |
3.3.2 zstd压缩算法核心原理分析与研究 | 第32-33页 |
3.3.3 zstd压缩算法的不足 | 第33页 |
3.3.4 zstd压缩算法改进 | 第33-36页 |
3.4 弹性数据压缩方案设计 | 第36-48页 |
3.4.1 系统架构 | 第36-38页 |
3.4.2 EDCMaster字典管理模块设计 | 第38-42页 |
3.4.3 EDCClient字典管理模块设计 | 第42-43页 |
3.4.4 EDC检测模块设计 | 第43-47页 |
3.4.5 EDC压缩和解压缩模块设计 | 第47-48页 |
3.4.6 方案解决的问题 | 第48页 |
3.5 本章小结 | 第48-49页 |
第四章 分布式存储中弹性数据压缩方案的实现 | 第49-60页 |
4.1 EDCMaster字典管理模块实现 | 第49-53页 |
4.1.1 字典制作 | 第49-50页 |
4.1.2 字典同步处理 | 第50-53页 |
4.2 EDCClient字典管理模块实现 | 第53-54页 |
4.3 EDC检测模块实现 | 第54-56页 |
4.4 EDC压缩和解压缩模块实现 | 第56-59页 |
4.5 本章小结 | 第59-60页 |
第五章 测试与结果分析 | 第60-70页 |
5.1 测试环境 | 第60-61页 |
5.2 测试数据集 | 第61-62页 |
5.3 文件可压缩性检测准确率测试 | 第62-63页 |
5.4 zstd算法改进前后性能测试 | 第63-64页 |
5.5 功能性测试 | 第64-66页 |
5.5.1 数据压缩透明性测试 | 第64-66页 |
5.5.2 空间存储效率对比测试 | 第66页 |
5.6 性能测试 | 第66-69页 |
5.6.1 字典同步性能测试 | 第66-67页 |
5.6.2 IO吞吐率对比测试 | 第67-69页 |
5.7 本章小结 | 第69-70页 |
第六章 总结和展望 | 第70-72页 |
6.1 总结 | 第70页 |
6.2 展望 | 第70-72页 |
致谢 | 第72-73页 |
参考文献 | 第73-75页 |