首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

基于Hadoop的重复数据删除技术研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-12页
    1.1 课题背景及意义第9-10页
    1.2 国内外研究现状第10-11页
    1.3 本文主要工作第11页
    1.4 本文组织结构第11-12页
第2章 重复数据删除技术概述第12-19页
    2.1 重复数据删除技术第12页
    2.2 文件级别的重复数据删除第12-13页
    2.3 数据块级别的重复数据删除第13-15页
        2.3.1 固定长度的分块第13页
        2.3.2 基于内容的分块第13-15页
        2.3.3 基于滑块的分块第15页
    2.4 重复数据删除技术在分布式系统中的应用第15-17页
        2.4.1 HYDRAstor第16页
        2.4.2 DEBAR第16-17页
    2.5 研究点和发展方向第17-18页
        2.5.1 去重率和吞吐量的权衡第18页
        2.5.2 去重技术的安全性第18页
        2.5.3 去重技术与云计算的结合第18页
    2.6 本章小结第18-19页
第3章 基于内容的分块方法研究第19-29页
    3.1 DRabin算法第19-21页
    3.2 基于TTTD的改进算法TDOB第21-25页
        3.2.1 TTTD算法第22页
        3.2.2 TDOB算法第22-25页
    3.3 CubeHash算法第25-28页
        3.3.1 CubeHash算法流程第26-27页
        3.3.2 迭代函数f_C第27页
        3.3.3 CubeHash算法性能分析第27-28页
    3.4 本章小结第28-29页
第4章 重复数据删除技术在Hadoop平台中的应用研究第29-44页
    4.1 Hadoop关键技术研究第29-34页
        4.1.1 Hadoop技术背景第29-30页
        4.1.2 分布式文件系统HDFS第30-33页
        4.1.3 MapReduce编程模型第33-34页
        4.1.4 Hadoop数据库HBase第34页
    4.2 重复数据删除技术在Hadoop平台中的应用研究第34-43页
        4.2.1 系统架构第34-38页
        4.2.2 文件的存取操作第38-40页
        4.2.3 存取性能优化第40-43页
    4.3 本章小结第43-44页
第5章 数值实验第44-53页
    5.1 实验环境第44-48页
        5.1.1 硬件描述第44页
        5.1.2 软件描述第44页
        5.1.3 Hadoop平台搭建第44-48页
    5.2 实验过程及结果分析第48-52页
        5.2.1 数据集第48-49页
        5.2.2 DRabin算法的正确性和高效性分析第49-50页
        5.2.3 TDOB算法的性能分析第50-52页
    5.3 本章小结第52-53页
第6章 总结与展望第53-55页
    6.1 全文总结第53页
    6.2 未来展望第53-55页
参考文献第55-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:基于OPED的CT投影数据重建算法及三维可视化研究
下一篇:时空同现模式挖掘的研究