首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向农业领域知识库构建的数据清洗方法优化研究

摘要第6-7页
Abstract第7页
第一章 引言第13-20页
    1.1 研究背景与意义第13-14页
        1.1.1 研究背景第13-14页
        1.1.2 研究意义第14页
    1.2 国内外研究现状第14-16页
        1.2.1 国外研究现状第14-16页
        1.2.2 国内研究现状第16页
    1.3 研究方法与内容第16-18页
        1.3.1 研究方法第16-17页
        1.3.2 研究内容第17页
        1.3.3 技术路线图第17-18页
    1.4 论文组织架构第18-19页
    1.5 研究结论及创新点第19-20页
第二章 数据清洗相关理论与工具第20-25页
    2.1 数据清洗方法第20-22页
        2.1.1 异构数据的模式转化方法第21页
        2.1.2 异常值清洗算法第21页
        2.1.3 缺失值清洗算法第21-22页
        2.1.4 数据匹配算法第22页
    2.2 数据清洗的一般流程第22页
    2.3 数据清洗的评价标准第22页
    2.4 数据清洗的工具第22-25页
        2.4.1 综合数据清洗工具第22-23页
        2.4.2 专业领域数据清洗工具第23页
        2.4.3 用于特定数据类型的数据清洗工具第23-25页
第三章 数据清洗核心方法分析第25-37页
    3.1 数据清洗方法分析第25-26页
    3.2 数据匹配方法分析第26-37页
        3.2.1 字段匹配算法及对比分析第26-30页
            3.2.1.1 基于字符的算法第26页
            3.2.1.2 基于Token的算法第26-27页
            3.2.1.3 基于发音相似的算法第27-28页
            3.2.1.4 字段匹配算法对比分析第28-30页
        3.2.2 记录检测算法及对比分析第30-35页
            3.2.2.1 有监督的算法第30-32页
            3.2.2.2 无监督的算法第32-33页
            3.2.2.3 半监督的算法第33页
            3.2.2.4 基于距离的方法第33-34页
            3.2.2.5 基于规则的方法第34页
            3.2.2.6 记录检测算法对比分析第34-35页
        3.2.3 分块方法对比分析第35-37页
第四章 数据清洗方法优化设计第37-43页
    4.1 面向农业领域知识库构建的数据清洗特点第37-38页
    4.2 数据清洗框架第38-40页
    4.3 清洗流程第40-43页
第五章 实证研究——以水稻领域文献数据为例第43-57页
    5.1 文献数据的特点第43-44页
    5.2 数据来源第44页
    5.3 清洗流程应用第44-47页
        5.3.1 确定数据集中存在的数据质量问题第44页
        5.3.2 明确数据清洗的优先级第44-45页
        5.3.3 确定数据清洗方法及顺序第45页
        5.3.4 工具选择第45-46页
        5.3.5 算法设计第46-47页
        5.3.6 确定评价标准第47页
    5.4 实验第47-57页
        5.4.1 对比组试验第47-51页
        5.4.2 数据清洗实验第51-57页
第六章 结论第57-59页
    6.1 总结第57页
    6.2 展望第57-59页
参考文献第59-64页
致谢第64-65页
作者简历第65页

论文共65页,点击 下载论文
上一篇:基于百度地图的协同指挥系统
下一篇:融合立体视觉与深度传感器的三维重建算法