首页--经济论文--工业经济论文--中国工业经济论文--工业建设与发展论文

工业大数据相似重复记录数据清洗关键技术研究

摘要第2-3页
abstract第3页
第一章 绪论第6-12页
    1.1 研究背景第6页
    1.2 研究意义第6-7页
    1.3 研究现状分析第7-9页
        1.3.1 数据清洗研究现状第7-8页
        1.3.2 工业大数据清洗研究现状第8-9页
        1.3.3 存在的问题第9页
    1.4 研究内容及组织结构第9-11页
    1.5 本章小结第11-12页
第二章 数据清洗基础理论和关键技术第12-23页
    2.1 数据质量和数据清洗第12-15页
        2.1.1 数据质量问题分类第12-13页
        2.1.2 数据清洗过程第13-15页
    2.2 相似重复记录清洗第15-17页
        2.2.1 字段相似检测算法第15-16页
        2.2.2 相似重复记录检测算法第16-17页
    2.3 缺省值清洗第17-19页
        2.3.1 缺失值清洗算法总体描述第18页
        2.3.2 缺失字段处理方式第18-19页
    2.4 离群点清洗第19-22页
        2.4.1 基于统计的离群点检测第19-20页
        2.4.2 基于距离的离群点检测第20页
        2.4.3 基于聚类的离群点检测第20-22页
    2.5 本章小结第22-23页
第三章 相似重复记录清洗方案第23-38页
    3.1 典型的数据清洗方案第23页
    3.2 相似重复记录清洗模型第23-24页
    3.3 数据预处理过程第24-28页
        3.3.1 属性选择及格式统一第24-25页
        3.3.2 记录排序第25页
        3.3.3 属性综合权重分配第25-28页
    3.4 重复记录检测第28-32页
        3.4.1 字段匹配算法第28-30页
        3.4.2 记录匹配算法第30-32页
    3.5 重复记录聚类第32-36页
        3.5.1 SNM算法工作原理第32-33页
        3.5.2 SNM算法分析第33-34页
        3.5.3 SNM算法改进详细过程第34-36页
    3.6 冲突解决第36-37页
    3.7 本章小结第37-38页
第四章 基于改进SNM算法的工业大数据清洗机制及仿真实验第38-50页
    4.1 工业大数据数据采集分析第38-40页
    4.2 工业大数据数据清洗架构第40-41页
    4.3 SNM算法在工业大数据中的应用第41-43页
        4.3.1 基于长度过滤的并行化实现第41-42页
        4.3.2 改进的SNM算法的并行化实现第42页
        4.3.3 SNM算法在工业大数据中的应用第42-43页
    4.4 实验设计与评价标准第43-45页
        4.4.1 实验数据集及参数设置第43-44页
        4.4.2 评价指标第44-45页
    4.5 算法测试结果及分析第45-48页
        4.5.1 基于长度过滤及综合权值的编辑距离算法第45-47页
        4.5.2 基于动态滑动窗口的SNM算法第47-48页
    4.6 本章小结第48-50页
第五章 总结与展望第50-51页
参考文献第51-54页
攻读学位期间的研究成果第54-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:精准扶贫背景下的民族地区农村人力资源开发研究
下一篇:厦门市农药市场监管问题与对策研究