首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于机器学习的多源异构大数据清洗技术研究

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-18页
    1.1 研究背景第10-11页
    1.2 相关研究进展第11-16页
        1.2.1 相似重复数据清洗第13-14页
        1.2.2 不精确数据清洗第14-15页
        1.2.3 机器学习的应用第15-16页
    1.3 本文工作内容第16-17页
    1.4 文章组织结构第17-18页
第二章 数据清洗技术概述第18-28页
    2.1 数据清洗第18-21页
        2.1.1 主要研究内容第18-20页
        2.1.2 面临的问题与挑战第20-21页
    2.2 机器学习技术第21-25页
        2.2.1 贝叶斯网络第22-23页
        2.2.2 粗糙集理论第23-25页
    2.3 ETL工具第25-27页
    2.4 本章小结第27-28页
第三章 基于贝叶斯网络的层次约减分类清洗方法第28-40页
    3.1 问题的提出第28-29页
    3.2 层次约减模型设计第29-35页
        3.2.1 数据源约减模型第29-31页
        3.2.2 标记属性与元组的权重第31-33页
        3.2.3 重要度度量算法设计第33-35页
    3.3 TAN网模型构建第35-39页
    3.4 本章小结第39-40页
第四章 基于粗糙集的属性约减联合清洗方法第40-51页
    4.1 问题的提出第40-42页
    4.2 建立数据属性标准库第42-43页
    4.3 基于粗糙集的属性约减第43-47页
    4.4 联合清洗算法设计第47-50页
    4.5 本章小结第50-51页
第五章 实验第51-67页
    5.1 实验环境与数据第51-56页
        5.1.1 实验环境第51-52页
        5.1.2 数据准备第52-53页
        5.1.3 模型训练第53-54页
        5.1.4 性能测试第54-56页
    5.2 实验与分析第56-65页
        5.2.1 不精确数据清洗实验设计第57-62页
        5.2.2 相似重复数据清洗对比实验第62-65页
    5.3 本章小结第65-67页
第六章 结束语第67-69页
    6.1 工作总结第67-68页
    6.2 工作展望第68-69页
参考文献第69-74页
致谢第74-75页
攻读硕士学位期间参加科研情况第75页

论文共75页,点击 下载论文
上一篇:融合特征属性、网络结构和社交行为的用户有向关系强度研究
下一篇:基于数据热点和分片性能差异的MongoDB自适应负载均衡策略研究