首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

不确定性数据库中的相似重复记录检测方法

摘要第3-4页
Abstract第4-5页
第一章 绪论第8-14页
    1.1 研究背景及意义第8-10页
    1.2 国内外研究状况第10-11页
    1.3 主要研究内容第11-12页
    1.4 论文结构第12-14页
第二章 背景知识第14-23页
    2.1 不确定性数据及不确定性数据库概述第14-15页
    2.2 数据质量与数据清洗第15-17页
    2.3 相似重复记录检测第17-22页
        2.3.1 相似重复记录概述第17-19页
        2.3.2 属性相似度的度量第19-20页
        2.3.3 相似重复记录的判定第20-22页
    2.4 本章小结第22-23页
第三章 不确定性数据中属性相似度计算第23-31页
    3.1 问题陈述第23-24页
    3.2 不确定性数据中属性相似度的计算第24-30页
        3.2.1 基于编辑距离法的思想第24-25页
        3.2.2 不确定性数据中属性相似度的计算方法第25-28页
        3.2.3 PMDU算法描述第28-30页
    3.3 本章小结第30-31页
第四章 不确定性数据中记录的匹配第31-37页
    4.1 基本思想第31页
    4.2 不确定性数据中记录相似度计算第31-35页
        4.2.1 属性相似度的贡献第31-33页
        4.2.2 基于叠加方法的记录相似度计算第33-35页
    4.3 不确定性数据中相似重复记录的判断第35-36页
    4.4 本章小结第36-37页
第五章 实验结果第37-44页
    5.1 实验设置第37页
    5.2 实验测试第37-43页
        5.2.1 PMDU方法的执行效率第37-38页
        5.2.2 PCSC方法的有效性第38-40页
        5.2.3 相似重复记录检测的验证第40-43页
    5.3 本章小结第43-44页
第六章 总结与展望第44-45页
附录第45-51页
参考文献第51-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:基于多核融合的中文领域实体关系抽取研究
下一篇:基于SIFT算法的水下多CCD图像拼接技术