网络表格间的关联关系发现
致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7页 |
1 引言 | 第10-18页 |
1.1 研究背景和意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-15页 |
1.2.1 网络表格间的合并关系 | 第11-13页 |
1.2.2 网络表格间的连接关系 | 第13-14页 |
1.2.3 数据间的复制关系 | 第14-15页 |
1.3 本文完成的工作 | 第15-16页 |
1.4 本文的组织结构 | 第16-18页 |
2 网络表格间的关联关系发现问题概述 | 第18-28页 |
2.1 网络表格 | 第18-19页 |
2.2 语义数据库 | 第19-25页 |
2.2.1 Freebase | 第20-22页 |
2.2.2 Probase | 第22-23页 |
2.2.3 HowNet | 第23-25页 |
2.3 AcsDB | 第25-26页 |
2.4 BAYES定理 | 第26-27页 |
2.5 本章小结 | 第27-28页 |
3 网络表格间的快照关系发现 | 第28-50页 |
3.1 问题描述 | 第28-30页 |
3.2 快照关系定义 | 第30页 |
3.3 快照的检测过程 | 第30-43页 |
3.3.1 预处理 | 第32-34页 |
3.3.2 基于实体和属性重合度的初筛选 | 第34-39页 |
3.3.3 基于表格内容的增强算法 | 第39-43页 |
3.3.4 结合实体内容的评分 | 第43页 |
3.4 快照关系的评估 | 第43-48页 |
3.4.1 实验设置 | 第43-44页 |
3.4.2 快照提取算法的评估 | 第44-46页 |
3.4.3 快照关系的有效性评估 | 第46-48页 |
3.5 本章小结 | 第48-50页 |
4 网络表格间的参照关系发现 | 第50-74页 |
4.1 问题描述 | 第50-52页 |
4.2 参照关系定义 | 第52-54页 |
4.3 参照表的检测过程 | 第54-62页 |
4.3.1 基于向量模型的实体相关度 | 第55-60页 |
4.3.2 属性相关度 | 第60-61页 |
4.3.3 参照相关度 | 第61-62页 |
4.4 参照关系的评估 | 第62-71页 |
4.4.1 实验设置 | 第62-63页 |
4.4.2 评估方法与指标 | 第63-64页 |
4.4.3 实体权重对参照关系提取结果的影响 | 第64-67页 |
4.4.4 参照表的质量评估 | 第67-70页 |
4.4.5 参照关系的有效性评估 | 第70-71页 |
4.5 本章小结 | 第71-74页 |
5 总结与展望 | 第74-76页 |
5.1 研究工作总结 | 第74-75页 |
5.2 进一步研究工作 | 第75-76页 |
参考文献 | 第76-80页 |
作者简历 | 第80-84页 |
学位论文数据集 | 第84页 |