首页--经济论文--经济计划与管理论文--企业经济论文--企业计划与经营决策论文

大数据应用中数据唯一性质量检测关键技术研究

摘要第5-6页
Abstract第6页
1 绪论第10-18页
    1.1 研究背景和意义第10-12页
    1.2 数据质量第12-14页
        1.2.1 数据质量定义第12-13页
        1.2.2 数据质量产生原因第13-14页
    1.3 研究现状第14-17页
        1.3.1 国外研究现状第14-16页
        1.3.2 国内研究现状第16-17页
    1.4 论文组织结构第17-18页
2 相似重复记录检测技术研究第18-30页
    2.1 相似重复记录检测概述第18-21页
        2.1.1 相似重复记录第18-19页
        2.1.2 相似重复记录检测第19-21页
    2.2 属性值匹配方法介绍第21-24页
        2.2.1 编辑距离算法第21-22页
        2.2.2 Smith-Waterman算法第22-23页
        2.2.3 N-gram算法第23页
        2.2.4 Jaro距离算法第23-24页
    2.3 决策模型介绍第24-25页
        2.3.1 基于分类的方法第24-25页
        2.3.2 基于距离的方法第25页
    2.4 相似重复记录检测算法介绍第25-28页
        2.4.1 Blocking算法第25-26页
        2.4.2 近邻排序算法第26-27页
        2.4.3 排序分块算法第27-28页
    2.5 本章小结第28-30页
3 分块近邻匹配算法第30-42页
    3.1 算法设计第30-33页
    3.2 性能分析第33-35页
    3.3 多字段分块近邻匹配算法第35-37页
    3.4 实验分析第37-40页
        3.4.1 实验环境第37页
        3.4.2 实验参数第37-38页
        3.4.3 实验结果第38-40页
    3.5 本章小结第40-42页
4 并行化分块近邻匹配算法第42-50页
    4.1 Map Reduce编程模型第42页
    4.2 并行化分块近邻匹配算法第42-45页
    4.3 实验结果分析第45-48页
        4.3.1 实验环境第45-46页
        4.3.2 实验结果第46-48页
    4.4 本章小结第48-50页
5 原型系统设计与实现第50-62页
    5.1 系统分析与设计第50-52页
    5.2 系统架构第52-53页
    5.3 主要模块实现第53-61页
        5.3.1 数据源管理第53-56页
        5.3.2 数据转换功能第56-58页
        5.3.3 数据分析功能第58-61页
    5.4 本章小结第61-62页
6 总结与展望第62-64页
    6.1 总结第62页
    6.2 展望第62-64页
参考文献第64-68页
攻读学位期间发表论文及科研情况第68-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:创新型中小企业校企合作模式研究
下一篇:HF公司全面质量管理应用研究