首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

数据清洗技术研究及清洗框架的设计与实现

摘要第4-6页
ABSTRACT第6-7页
第1章 绪论第11-17页
    1.1 论文研究背景与意义第11-12页
        1.1.1 研究背景及问题的提出第11页
        1.1.2 研究意义第11-12页
    1.2 数据清洗国内外研究现状第12-15页
        1.2.1 国外研究现状第12-14页
        1.2.2 国内研究现状第14-15页
    1.3 研究目的与主要内容第15页
    1.4 论文组织结构及章节编排第15-17页
第2章 数据质量与数据清洗第17-26页
    2.1 数据质量第17-21页
        2.1.1 数据质量的定义第17-18页
        2.1.2 数据质量问题的分类第18-20页
        2.1.3 数据质量的产生原因第20-21页
    2.2 数据清洗第21-25页
        2.2.1 数据清洗的定义第21-22页
        2.2.2 数据清洗的原理第22-23页
        2.2.3 数据清洗的一般过程第23-25页
    2.3 本章小结第25-26页
第3章 主要清洗算法的研究与分析改进第26-33页
    3.1 主要重复记录清洗算法第26-32页
        3.1.1 DIT算法第27-29页
        3.1.2 DDID算法第29-30页
        3.1.3 邻窗比对法第30-31页
        3.1.4 改进的算法——相似度加权算法第31-32页
    3.2 异常记录检测算法第32页
    3.3 本章小结第32-33页
第4章 清洗框架设计与实现第33-66页
    4.1 需求分析与开发环境介绍第33-35页
        4.1.1 需求分析第33-34页
        4.1.2 框架设计开发环境第34-35页
    4.2 框架设计原则和系统技术架构第35-39页
        4.2.1 框架设计原则第35-37页
        4.2.2 系统技术架构第37-39页
    4.3 清洗框架总体设计第39-48页
        4.3.1 框架总体设计思路第39-41页
        4.3.2 数据表结构设计第41-44页
        4.3.3 程序主要包层次结构图第44-45页
        4.3.4 总设计流程第45-48页
    4.4 清洗框架细节实现第48-65页
        4.4.1 数据注册第48-50页
        4.4.2 映射关系配置与审核第50-52页
        4.4.3 数据上传第52-53页
        4.4.4 重复数据清洗第53-58页
        4.4.5 关联关系清洗第58-60页
        4.4.6 字典清洗第60-64页
        4.4.7 数据同步第64-65页
    4.5 本章小结第65-66页
第5章 结果测试与分析第66-73页
    5.1 实验数据第66-67页
    5.2 实验测试与结果分析第67-72页
        5.2.1 元数据检查结果第67页
        5.2.2 数据校验结果第67-68页
        5.2.3 清洗流程测试结果第68-70页
        5.2.4 实验结果分析第70-72页
    5.3 本章小结第72-73页
第6章 结论与讨论第73-75页
    6.1 结论第73页
    6.2 讨论第73-75页
参考文献第75-77页
致谢第77页
攻读学位期间参加的科研项目第77页

论文共77页,点击 下载论文
上一篇:天津市幼儿园教师运用学习故事现状及影响因素研究
下一篇:加拿大阿尔伯塔省中小学公民教育研究--课程的视角