首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

海量劣质数据上冲突消解关键技术的研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-18页
    1.1 课题背景及研究的目的和意义第8-9页
    1.2 冲突消解相关领域的研究现状第9-13页
        1.2.1 数据质量(Data Quality)第10-11页
        1.2.2 数据清洗第11-12页
        1.2.3 数据集成第12-13页
    1.3 冲突消解的研究现状第13-15页
        1.3.1 国内在冲突消解上的研究第13-14页
        1.3.2 国外在冲突消解上的研究第14-15页
    1.4 本文的主要研究内容第15-18页
第2章 在多数据源数据集成中增量式的真值发现算法的研究第18-33页
    2.1 问题简介第18-19页
        2.1.1 现有方法第19页
    2.2 基础框架第19-24页
        2.2.1 问题定义第19-21页
        2.2.2 贝叶斯模型第21-24页
    2.3 增量模型第24-27页
        2.3.1 一些定义第24-25页
        2.3.2 投票策略第25-26页
        2.3.3 初始化模块第26页
        2.3.4 投票过程第26-27页
        2.3.5 更新过程第27页
    2.4 概念偏移第27-29页
    2.5 实验结论第29-32页
        2.5.1 在电影导演数据集上的实验结果第30-31页
        2.5.2 在书籍作者数据集上的实验结果第31-32页
        2.5.3 效率测试第32页
    2.6 本章小结第32-33页
第3章 基于 MAPREDUCE 的增量真值发现算法的研究第33-54页
    3.0 MAPREDUCE 技术概述第33-34页
    3.1 算法的总体架构第34-36页
    3.2 基于 BASETF 的 MAPREDUCE 算法第36-45页
        3.2.1 数据格式与预处理第36-38页
        3.2.2 全局数据的处理第38-39页
        3.2.3 分割过程(Splitting)第39-41页
        3.2.4 描述处理过程(ClaimProcess)第41-43页
        3.2.5 值处理过程(ValueProcess)第43-45页
    3.3 增量式的 MAPREDUCE 算法第45-49页
        3.3.1 一些增量优化策略第45页
        3.3.2 基于 Hadoop 的真值发现框架-Incoop第45-47页
        3.3.3 进一步增量优化 MPTF第47-49页
    3.4 MAPREDUCE 的优化第49-51页
    3.5 实验第51-53页
    3.6 本章小结第53-54页
第4章 冲突消解系统的研究与设计第54-62页
    4.1 冲突消解系统的整体架构第54-56页
        4.1.1 冲突消解的定义第54-55页
        4.1.2 各个模块之间的关系第55-56页
    4.2 预处理过程第56-57页
    4.3 冲突检测的过程第57-58页
    4.4 描述冲突消解第58-59页
    4.5 语义冲突消解第59-60页
    4.6 增量策略第60页
    4.7 一些通用的函数第60-61页
    4.8 本章小结第61-62页
结论第62-64页
参考文献第64-68页
攻读硕士学位期间发表的论文第68-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:基于Hadoop的移动互联网网站与服务器流量分析
下一篇:基于Hadoop的移动互联网数据导入系统的设计与实现