摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第12-18页 |
1.1 课题研究背景 | 第12-13页 |
1.2 国内外研究现状 | 第13-15页 |
1.2.1 国内教育资源库发展现状 | 第13页 |
1.2.2 重复数据删除技术研究现状 | 第13-15页 |
1.3 研究目标及意义 | 第15-16页 |
1.4 主要研究内容 | 第16-17页 |
1.5 论文结构安排 | 第17-18页 |
第二章 研究的理论基础 | 第18-29页 |
2.1 重复数据删除核心技术 | 第18-23页 |
2.1.1 固定长度分块 | 第18-19页 |
2.1.2 可变长度分块 | 第19-20页 |
2.1.3 高可靠性哈希算法MD5和SHA-1 | 第20-23页 |
2.1.4 布隆过滤器技术 | 第23页 |
2.2 重复数据删除技术实现方式 | 第23-24页 |
2.2.1 源端消重与目的端消重 | 第23-24页 |
2.2.2 在线去重与离线去重 | 第24页 |
2.3 Spring框架 | 第24-28页 |
2.3.1 容器 | 第25-26页 |
2.3.2 控制反转(IoC) | 第26-27页 |
2.3.3 面向切面编程(AOP) | 第27-28页 |
2.4 本章小结 | 第28-29页 |
第三章 系统的需求分析 | 第29-35页 |
3.1 系统用户分析 | 第29页 |
3.2 系统功能需求分析 | 第29-34页 |
3.2.1 数据块的划分 | 第29-30页 |
3.2.2 特征值的提取 | 第30页 |
3.2.3 元数据的组织 | 第30-31页 |
3.2.4 重复数据的检测 | 第31页 |
3.2.5 系统资源模块 | 第31-33页 |
3.2.6 系统用户模块 | 第33页 |
3.2.7 系统积分模块 | 第33-34页 |
3.3 系统性能需求分析 | 第34页 |
3.4 本章小结 | 第34-35页 |
第四章 基于重复数据删除的教育资源管理系统设计 | 第35-52页 |
4.1 系统架构设计 | 第35-37页 |
4.1.1 系统整体架构 | 第35-36页 |
4.1.2 系统拓扑结构 | 第36-37页 |
4.2 重复数据删除流程 | 第37-38页 |
4.3 基于可变长度分块CDC算法的改进 | 第38-39页 |
4.4 数据块的组织 | 第39-40页 |
4.4.1 特征值的存储 | 第39页 |
4.4.2 数据块的存储 | 第39-40页 |
4.4.3 数据块的删除 | 第40页 |
4.5 基于BloomFilter算法的重复数据检测 | 第40-42页 |
4.5.1 位数组的设计 | 第40-41页 |
4.5.2 位数组调度策略 | 第41-42页 |
4.6 系统资源模块的设计 | 第42-47页 |
4.6.1 资源的存储 | 第42-43页 |
4.6.2 资源的上传 | 第43页 |
4.6.3 资源的检索 | 第43-44页 |
4.6.4 资源的下载 | 第44-45页 |
4.6.5 资源的恢复 | 第45页 |
4.6.6 资源的删除 | 第45-46页 |
4.6.7 资源类型配置 | 第46-47页 |
4.7 系统用户模块的设计 | 第47-48页 |
4.7.1 基本信息维护 | 第47页 |
4.7.2 管理系统用户 | 第47页 |
4.7.3 用户权限配置 | 第47-48页 |
4.8 系统积分模块的设计 | 第48页 |
4.8.1 积分查询 | 第48页 |
4.8.2 积分配置 | 第48页 |
4.9 数据库逻辑结构设计 | 第48-51页 |
4.10 本章小结 | 第51-52页 |
第五章 基于重复数据删除的教育资源管理系统实现 | 第52-68页 |
5.1 重复数据删除模块的实现 | 第52-57页 |
5.1.1 基于CDC改进分块算法的实现 | 第52-54页 |
5.1.2 基于MD5算法的数据指纹 | 第54页 |
5.1.3 基于BloomFilter的指纹比对 | 第54-56页 |
5.1.4 数据块的存储 | 第56-57页 |
5.1.5 数据块的删除 | 第57页 |
5.2 系统资源模块的实现 | 第57-63页 |
5.2.1 资源的上传 | 第57-59页 |
5.2.2 基于Hibernate Search全文检索 | 第59-60页 |
5.2.3 资源的下载 | 第60页 |
5.2.4 资源的恢复 | 第60-62页 |
5.2.5 资源的删除 | 第62页 |
5.2.6 资源的类型配置 | 第62-63页 |
5.3 系统用户模块的实现 | 第63-65页 |
5.3.1 信息的维护 | 第63-64页 |
5.3.2 用户的管理 | 第64页 |
5.3.3 权限的配置 | 第64-65页 |
5.4 系统积分模块的实现 | 第65-67页 |
5.4.1 用户积分 | 第65-66页 |
5.4.2 积分配置 | 第66-67页 |
5.5 本章小结 | 第67-68页 |
第六章 系统测试与分析 | 第68-80页 |
6.1 测试环境 | 第68-69页 |
6.1.1 硬件环境 | 第68页 |
6.1.2 软件环境 | 第68-69页 |
6.2 系统功能测试 | 第69-75页 |
6.2.1 测试用例 | 第69-72页 |
6.2.2 测试结果 | 第72-75页 |
6.3 系统性能测试 | 第75-79页 |
6.3.1 资源存储空间测试 | 第75-76页 |
6.3.2 重复数据删除率测试 | 第76-77页 |
6.3.3 改进CDC算法性能测试 | 第77页 |
6.3.4 系统并发性能测试 | 第77-79页 |
6.4 本章小结 | 第79-80页 |
第七章 总结与展望 | 第80-82页 |
7.1 论文总结 | 第80页 |
7.2 工作展望 | 第80-82页 |
致谢 | 第82-83页 |
参考文献 | 第83-87页 |
攻读硕士学位期间取得的成果 | 第87-88页 |