首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于众包的数据清洗关键技术的研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-19页
    1.1 课题背景及研究的目的和意义第8-9页
    1.2 数据质量第9-12页
        1.2.1 单数据源上的数据质量问题第9-11页
        1.2.2 多数据源上的数据质量问题第11-12页
    1.3 数据清洗的研究现状第12-16页
        1.3.1 数据去重第12-14页
        1.3.2 数据一致性第14页
        1.3.3 数据完整性第14-16页
        1.3.4 数据精确性第16页
    1.4 基于众包的数据清洗研究现状第16-17页
    1.5 本文的主要研究内容及组织结构第17-19页
第2章 支持数据清洗的众包技术第19-31页
    2.1 基于众包的主动学习模型第19-23页
        2.1.1 直接主动学习模型第20-22页
        2.1.2 交互主动学习模型第22-23页
    2.2 众包记录的选择第23-25页
        2.2.1 信息价值评估第23-24页
        2.2.2 选择方法第24-25页
    2.3 众包反馈的优化第25-28页
        2.3.1 问题假设和定义第26页
        2.3.2 工人可信度和真值置信度的计算第26-27页
        2.3.3 众包反馈优化算法第27-28页
    2.4 实验第28-30页
        2.4.1 主动学习的有效性第28-30页
        2.4.2 不确定记录选择机制评估第30页
    2.5 本章小结第30-31页
第3章 基于众包的数据清洗第31-50页
    3.1 基于众包的真值发现第31-35页
        3.1.1 问题定义第32页
        3.1.2 整体框架第32-33页
        3.1.3 众包记录的选择第33-34页
        3.1.4 实验验证与分析第34-35页
    3.2 基于众包的缺失值填充第35-42页
        3.2.1 问题定义第36-37页
        3.2.2 整体框架第37-38页
        3.2.3 众包记录的选择第38-40页
        3.2.4 实验验证与分析第40-42页
    3.3 基于众包的实体识别第42-49页
        3.3.1 问题定义第43-44页
        3.3.2 整体框架第44-45页
        3.3.3 众包记录对的选择第45-46页
        3.3.4 实验验证与分析第46-49页
    3.4 本章小结第49-50页
第4章 基于众包的数据清洗系统的研究与设计第50-55页
    4.1 整体架构第51页
    4.2 模块概述第51-54页
    4.3 本章小结第54-55页
结论第55-57页
参考文献第57-61页
攻读硕士学位期间发表的论文第61-62页
致谢第62-63页

论文共63页,点击 下载论文
上一篇:基于候选生成的猫脸检测
下一篇:基于计算机视觉的智能停车场引导系统研究