摘要 | 第1-6页 |
Abstract | 第6-10页 |
1 绪论 | 第10-25页 |
·数据去重的研究背景 | 第10-13页 |
·重复数据的界定方法 | 第13-16页 |
·去重效率的评估方法 | 第16-18页 |
·数据去重的研究现状 | 第18-22页 |
·本文的主要研究内容 | 第22-25页 |
2 数据指纹的快速计算方法 | 第25-44页 |
·可变长度分块技术 | 第25-33页 |
·两级去重方法的基本框架 | 第33-35页 |
·两级指纹的流水计算方法 | 第35-38页 |
·实验评估与结果分析 | 第38-43页 |
·本章小结 | 第43-44页 |
3 流式数据重复元素的快速检测方法 | 第44-66页 |
·静态数据集的快速索引方法 | 第44-47页 |
·非可扩展动态数据集的快速索引方法 | 第47-53页 |
·分离计数型布隆过滤器阵列 | 第53-57页 |
·理论分析与实验评估 | 第57-64页 |
·本章小结 | 第64-66页 |
4 可扩展数据集重复元素的速判方法 | 第66-85页 |
·可扩展数据集的快速索引方法 | 第66-69页 |
·动态布隆过滤器阵列 | 第69-75页 |
·实验评估与理论分析 | 第75-83页 |
·本章小结 | 第83-85页 |
5 高性能可扩展的数据去重方法 | 第85-104页 |
·去重存储系统的研究现状 | 第85-88页 |
·MAD2 数据去重方法 | 第88-94页 |
·实验评估与结果分析 | 第94-103页 |
·本章小结 | 第103-104页 |
6 全文总结 | 第104-107页 |
致谢 | 第107-108页 |
参考文献 | 第108-117页 |
附录 1 攻读博士学位期间发表的学术论文 | 第117-118页 |
附录 2 攻读博士学位期间参加的科研项目及申请的专利 | 第118页 |