摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第1章 绪论 | 第8-18页 |
1.1 课题背景及研究的目的和意义 | 第8-9页 |
1.2 冲突消解相关领域的研究现状 | 第9-13页 |
1.2.1 数据质量(Data Quality) | 第10-11页 |
1.2.2 数据清洗 | 第11-12页 |
1.2.3 数据集成 | 第12-13页 |
1.3 冲突消解的研究现状 | 第13-15页 |
1.3.1 国内在冲突消解上的研究 | 第13-14页 |
1.3.2 国外在冲突消解上的研究 | 第14-15页 |
1.4 本文的主要研究内容 | 第15-18页 |
第2章 在多数据源数据集成中增量式的真值发现算法的研究 | 第18-33页 |
2.1 问题简介 | 第18-19页 |
2.1.1 现有方法 | 第19页 |
2.2 基础框架 | 第19-24页 |
2.2.1 问题定义 | 第19-21页 |
2.2.2 贝叶斯模型 | 第21-24页 |
2.3 增量模型 | 第24-27页 |
2.3.1 一些定义 | 第24-25页 |
2.3.2 投票策略 | 第25-26页 |
2.3.3 初始化模块 | 第26页 |
2.3.4 投票过程 | 第26-27页 |
2.3.5 更新过程 | 第27页 |
2.4 概念偏移 | 第27-29页 |
2.5 实验结论 | 第29-32页 |
2.5.1 在电影导演数据集上的实验结果 | 第30-31页 |
2.5.2 在书籍作者数据集上的实验结果 | 第31-32页 |
2.5.3 效率测试 | 第32页 |
2.6 本章小结 | 第32-33页 |
第3章 基于 MAPREDUCE 的增量真值发现算法的研究 | 第33-54页 |
3.0 MAPREDUCE 技术概述 | 第33-34页 |
3.1 算法的总体架构 | 第34-36页 |
3.2 基于 BASETF 的 MAPREDUCE 算法 | 第36-45页 |
3.2.1 数据格式与预处理 | 第36-38页 |
3.2.2 全局数据的处理 | 第38-39页 |
3.2.3 分割过程(Splitting) | 第39-41页 |
3.2.4 描述处理过程(ClaimProcess) | 第41-43页 |
3.2.5 值处理过程(ValueProcess) | 第43-45页 |
3.3 增量式的 MAPREDUCE 算法 | 第45-49页 |
3.3.1 一些增量优化策略 | 第45页 |
3.3.2 基于 Hadoop 的真值发现框架-Incoop | 第45-47页 |
3.3.3 进一步增量优化 MPTF | 第47-49页 |
3.4 MAPREDUCE 的优化 | 第49-51页 |
3.5 实验 | 第51-53页 |
3.6 本章小结 | 第53-54页 |
第4章 冲突消解系统的研究与设计 | 第54-62页 |
4.1 冲突消解系统的整体架构 | 第54-56页 |
4.1.1 冲突消解的定义 | 第54-55页 |
4.1.2 各个模块之间的关系 | 第55-56页 |
4.2 预处理过程 | 第56-57页 |
4.3 冲突检测的过程 | 第57-58页 |
4.4 描述冲突消解 | 第58-59页 |
4.5 语义冲突消解 | 第59-60页 |
4.6 增量策略 | 第60页 |
4.7 一些通用的函数 | 第60-61页 |
4.8 本章小结 | 第61-62页 |
结论 | 第62-64页 |
参考文献 | 第64-68页 |
攻读硕士学位期间发表的论文 | 第68-70页 |
致谢 | 第70页 |