首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

异构数据源集成中清洗策略的研究及应用

第一章 绪论第7-12页
    1.1 选题背景第7-8页
    1.2 国内外研究的现况第8-10页
        1.2.1 异构数据源集成研究现况第8-9页
        1.2.2 数据清洗研究现况第9-10页
    1.3 研究的内容及意义第10-11页
        1.3.1 主要研究内容第10-11页
        1.3.2 研究的意义第11页
    1.4 论文的组织第11-12页
第二章 数据集成工具框架设计第12-20页
    2.1 异构数据源集成的过程分析第12-14页
    2.2 基于元数据的集成工具通用框架设计第14-20页
        2.2.1 数据集成面临的挑战第14-15页
        2.2.2 通用框架设计第15-17页
        2.2.3 通用框架中的元数据设计第17-18页
        2.2.4 通用框架中的异构数据源集成策略第18页
        2.2.5 通用框架小结第18-20页
第三章 数据清洗策略研究及其软件解决方案第20-32页
    3.1 数据集成中的数据质量问题第20-22页
        3.1.1 数据质量概念第20页
        3.1.2 数据质量问题分析第20-22页
    3.2 应用域无关的数据清洗策略第22-28页
        3.2.1 数据清洗功能的实现方式第22-23页
        3.2.2 基于清洗方式的脏数据分类法第23页
        3.2.3 应用域无关的数据清洗流程设计第23-25页
        3.2.4 数据源预清洗第25-26页
        3.2.5 单记录型脏数据清洗第26-28页
        3.2.6 多记录型脏数据清洗第28页
    3.3 清洗规则定制模块设计第28-32页
第四章 基于策略模式的缺损数据处理方法第32-39页
    4.1 缺损数据概述第32-33页
    4.2 策略类的结构设计第33-34页
    4.3 策略类的缺损数据处理算法设计与分析第34-38页
        4.3.1 简单缺损数据处理算法第34-35页
        4.3.2 KNN缺损数据处理算法第35-36页
        4.3.3 DTB缺损数据处理算法第36-38页
    4.4 缺损数据处理小结第38-39页
第五章 相似重复记录的对象识别过程第39-48页
    5.1 相似重复记录概述第39-41页
    5.2 对象识别过程框架设计第41-42页
    5.3 词法分析第42-43页
    5.4 记录特征标记第43-44页
    5.5 相似对象聚类第44-47页
        5.5.1 记录相似性分析第44-45页
        5.5.2 相似对象聚类算法设计第45-47页
    5.6 对象规约第47页
    5.7 实践与小结第47-48页
第六章 数据清洗在统一客户资料系统中的应用研究第48-58页
    6.1 统一客户资料系统总体设计第48-49页
    6.2 客户资料集成中清洗策略实施第49-53页
    6.3 客户资料清洗实验第53-57页
        6.3.1 相似重复记录识别实验第53-55页
        6.3.2 缺损数据处理实验第55-57页
    6.4 本章小结第57-58页
第七章 结束语第58-60页
    7.1 主要工作总结第58-59页
    7.2 进一步工作的展望第59-60页
参考文献第60-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:类圆形目标识别方法研究及系统实现
下一篇:供应链绩效评价指标体系研究