首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

基于存储系统的重复数据删除技术的研究

摘要第4-5页
Abstract第5-6页
专用术语注释表第9-10页
第一章 绪论第10-20页
    1.1 课题背景与意义第10-12页
        1.1.1 课题研究背景第10-11页
        1.1.2 课题研究意义第11-12页
    1.2 国内外研究现状第12-17页
    1.3 课题的研究内容及结果第17-18页
    1.4 论文的组织结构第18-20页
第二章 相关技术研究第20-39页
    2.1 重复数据删除技术第20-27页
        2.1.1 重复数据删除技术的定义第20-21页
        2.1.2 重复数据删除技术的分类第21-26页
        2.1.3 重复数据删除技术处理流程第26-27页
    2.2 数据指纹算法第27-28页
        2.2.1 MD5算法第27-28页
        2.2.2 SHA-1 算法第28页
    2.3 基于Simhash算法去重的相关技术第28-33页
        2.3.1 TF-IDF算法第29页
        2.3.2 Shingle算法第29-31页
        2.3.3 ICTCLAS分词系统第31页
        2.3.4 汉明距离介绍第31-32页
        2.3.5 Simhash函数第32-33页
    2.4 基于Bloom Filter算法去重的相关技术第33-38页
        2.4.1 Bloom Filter函数第34-35页
        2.4.2 Bloom Filter误判率分析第35-36页
        2.4.3 Bloom Filter最优函数个数第36页
        2.4.4 最优的位数组长度第36-37页
        2.4.5 错误校验机制第37-38页
    2.5 本章小结第38-39页
第三章 存储系统中Simhash算法的改进第39-47页
    3.1 算法设计背景第39-40页
    3.2 基于Simhash算法的相似数据检测改进研究第40-46页
        3.2.1 算法改进流程第40-41页
        3.2.2 算法的实现第41-46页
        3.2.3 改进后的Simhash算法性能对比分析第46页
    3.3 本章小结第46-47页
第四章 存储系统中Bloom Filter的改进第47-55页
    4.1 算法设计背景第47-49页
        4.1.1 Bloom Filter存在的缺点第47页
        4.1.2 错误校验机制存在的缺点第47-48页
        4.1.3 Bloom Filter的主要算法研究第48-49页
    4.2 基于Bloom Filter在重复数据删除技术中应用改进研究第49-53页
        4.2.1 算法改进流程第49-50页
        4.2.2 针对Bloom Filter产生假阳性问题的改进第50-52页
        4.2.3 针对引入假阴性值进行的错误校验机制问题的改进第52-53页
        4.2.4 改进后的算法性能分析第53页
    4.3 本章小结第53-55页
第五章 系统测试第55-61页
    5.1 基于Simhash算法相似性检测的测试第55-59页
        5.1.1 测试环境第55页
        5.1.2 测试数据选取第55-56页
        5.1.3 测试度量依据第56页
        5.1.4 实验结果与分析第56-59页
    5.2 针对Bloom Filter在重复数据删除中应用的测试第59-60页
        5.2.1 测试环境第59页
        5.2.2 测试数据选取第59页
        5.2.3 实验结果与分析第59-60页
    5.3 本章小结第60-61页
第六章 总结与展望第61-64页
    6.1 研究工作总结第61-62页
    6.2 研究工作展望第62-64页
参考文献第64-67页
附录1 攻读硕士学位期间撰写的论文第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:高新技术企业人力资本贡献率研究
下一篇:我国制造业技术创新与产品异质关联关系研究