首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于网络的数据清洗技术研究

摘要第4-5页
Abstract第5页
目录第6-8页
第1章 绪论第8-12页
    1.1 课题研究背景以及研究意义第8页
    1.2 数据清洗技术的研究现状第8-10页
        1.2.1 数据清洗技术的研究第8-9页
        1.2.2 实体识别的研究第9-10页
    1.3 本文主要研究内容第10页
    1.4 本文组织结构第10-12页
第2章 基于网络数据清洗框架第12-18页
    2.1 问题定义第12-16页
        2.1.1 数据质量问题定义第12-13页
        2.1.2 数据清洗的定义第13-14页
        2.1.3 基于网络的数据清洗的定义第14-16页
    2.2 基于网络数据清洗的整体框架第16-17页
        2.2.1 框架第16-17页
    2.3 本章小结第17-18页
第3章 数据质量问题检测第18-34页
    3.1 丢失值检测第18页
    3.2 错误值检测第18-20页
    3.3 冲突值检测第20-33页
        3.3.1 元组匹配第21-24页
        3.3.2 元组聚类第24-33页
    3.4 本章小结第33-34页
第4章 基于网络的模式获取第34-40页
    4.1 关键字生成第34-35页
    4.2 模式获取第35-40页
        4.2.1 与网络信息交互第35-36页
        4.2.2 挖掘模式第36-40页
第5章 基于网络模式的数据清洗第40-47页
    5.1 可行元组的选择第40-42页
        5.1.1 为什么要选择可行元组第40-42页
    5.2 其它清洗策略第42-43页
        5.2.1 使用 FD\CFD 进行清洗第42-43页
        5.2.2 使用真值发现算法清洗第43页
    5.3 基于网络模式的清洗第43-47页
        5.3.1 空缺值清洗第43-44页
        5.3.2 错误值清洗第44-45页
        5.3.3 冲突值清洗第45-47页
第6章 实验验证第47-65页
    6.1 元组匹配算法实验第47-52页
        6.1.1 效率、精确率和召回率第47-48页
        6.1.2 与已有算法的比较第48-49页
        6.1.3 参数影响第49-52页
    6.2 元组聚类算法实验第52-59页
        6.2.1 量化标准第52-53页
        6.2.2 使用 Zachary's karate club 测试第53-54页
        6.2.3 使用 College football 测试第54-55页
        6.2.4 在人工合成的数据上进行测试第55-57页
        6.2.5 在更多的真实数据上进行测试第57-59页
    6.3 基于网络的数据清洗算法实验第59-63页
        6.3.1 获取网络模式第59-61页
        6.3.2 对空缺值的清洗第61-62页
        6.3.3 对错误值的清洗第62-63页
        6.3.4 对冲突值的清洗第63页
    6.4 实验小结第63-65页
结论第65-66页
参考文献第66-70页
攻读硕士学位期间发表及在投的论文第70-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:社交网络中的用户标签推荐
下一篇:基于稀疏编码的群体异常行为检测