面向多关系数据的复制检测及真值发现算法
摘要 | 第5-6页 |
Abstract | 第6-7页 |
目录 | 第8-10页 |
第1章 绪论 | 第10-14页 |
1.1 课题研究背景 | 第10-11页 |
1.2 课题研究现状及挑战 | 第11-12页 |
1.3 本文的贡献 | 第12-13页 |
1.4 本文的组织结构 | 第13-14页 |
第2章 相关工作 | 第14-26页 |
2.1 复制检测算法 | 第14-21页 |
2.1.1 三方面复制检测算法总体介绍 | 第14-15页 |
2.1.2 关系数据复制检测算法详细介绍 | 第15-21页 |
2.2 真值发现算法 | 第21-25页 |
2.2.1 基于链接分析的算法 | 第21-23页 |
2.2.2 基于贝叶斯表述的算法 | 第23-24页 |
2.2.3 基于EM模型的算法 | 第24-25页 |
2.3 本章小结 | 第25-26页 |
第3章 背景知识与问题定义 | 第26-32页 |
3.1 函数依赖发现算法 | 第26-27页 |
3.2 贝叶斯法则 | 第27-28页 |
3.3 问题定义 | 第28-30页 |
3.4 本章小结 | 第30-32页 |
第4章 多关系数据上的复制检测 | 第32-46页 |
4.1 多关系数据上的复制检测算法基本原理 | 第32-35页 |
4.2 针对多关系数据的复制检测算法 | 第35-45页 |
4.2.1 复制检测算法总体描述 | 第35-36页 |
4.2.2 多关系数据预处理 | 第36-37页 |
4.2.3 数据源间数据特征分类 | 第37-41页 |
4.2.4 复制概率计算 | 第41-45页 |
4.3 本章小结 | 第45-46页 |
第5章 多关系数据上的真值发现 | 第46-56页 |
5.1 多关系数据上的真值发现算法基本原理 | 第46-49页 |
5.2 针对多关系数据的真值发现算法 | 第49-55页 |
5.2.1 真值发现算法总体描述 | 第49-50页 |
5.2.2 影响投票值的因素 | 第50-52页 |
5.2.3 投票值的计算 | 第52-54页 |
5.2.4 真值发现算法 | 第54-55页 |
5.3 本章小结 | 第55-56页 |
第6章 实验与分析 | 第56-68页 |
6.1 实验设置 | 第56-57页 |
6.2 复制检测 | 第57-64页 |
6.2.1 复制检测规则评估 | 第58-62页 |
6.2.2 参数影响评估 | 第62-64页 |
6.3 真值发现 | 第64-66页 |
6.3.1 真值发现规则评估 | 第64-66页 |
6.4 本章小结 | 第66-68页 |
第7章 结束语 | 第68-70页 |
7.1 本文总结 | 第68-69页 |
7.2 工作展望 | 第69-70页 |
参考文献 | 第70-74页 |
致谢 | 第74-76页 |
攻硕期间参加的项目及发表的论文 | 第76页 |