首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

中文重复记录清洗的相关算法的研究

摘要第2-3页
abstract第3页
第一章 绪论第6-10页
    1.1 研究背景及意义第6页
    1.2 国内外研究现状第6-8页
        1.2.1 国外研究现状第6-7页
        1.2.2 国内研究现状第7-8页
    1.3 研究内容与结构安排第8-10页
        1.3.1 研究内容第8页
        1.3.2 结构安排第8-10页
第二章 重复记录清洗的相关知识第10-22页
    2.1 数据清洗的定义第10页
    2.2 数据清洗的对象第10-13页
    2.3 重复记录清洗的相关算法第13-18页
        2.3.1 重复记录匹配算法第13-16页
        2.3.2 重复记录清除算法第16-18页
    2.4 中文重复记录清洗流程第18-21页
    2.5 本章小结第21-22页
第三章 基于编辑距离算法改进的字段匹配方法第22-32页
    3.1 传统编辑距离算法的弊端第22页
    3.2 算法的优化第22-28页
    3.3 算法的实现第28-30页
    3.4 实验及结果分析第30-31页
    3.5 本章小结第31-32页
第四章 一种基于图最大关联度的重复记录合并的方法第32-37页
    4.1 传统方法的弊端第32页
    4.2 基于图最大关联度的合并方法介绍第32-34页
        4.2.1 相关定义第32-33页
        4.2.2 方法介绍第33-34页
    4.3 算法的实现第34-35页
    4.4 实验及结果分析第35-36页
    4.5 本章小结第36-37页
第五章 基于SNM算法改进的重复记录清洗方法第37-48页
    5.1 SNM算法存在的弊端第37-38页
    5.2 SNM算法的改进第38-39页
    5.3 算法的实现第39-42页
    5.4 实验及结果分析第42-47页
        5.4.1 中文重复记录清洗实验第42-44页
        5.4.2 实验结果与分析第44-47页
    5.5 本章小节第47-48页
第六章 总结与展望第48-50页
    6.1 总结第48-49页
    6.2 展望第49-50页
参考文献第50-53页
攻读学位期间的研究成果第53-54页
致谢第54-55页

论文共55页,点击 下载论文
上一篇:基于稀疏表示的肝脏疾病诊断
下一篇:基于复杂网络的气象相关性网络模型研究与应用