关联数据中的实体链接研究
摘要 | 第4-5页 |
Abstract | 第5页 |
图目录 | 第8-9页 |
表目录 | 第9-10页 |
1 绪论 | 第10-16页 |
1.1 研究背景 | 第10-12页 |
1.2 研究意义 | 第12-16页 |
2 关联数据领域的国内外研究综述 | 第16-26页 |
2.1 国外研究 | 第16-21页 |
2.1.1 起源期 | 第16-17页 |
2.1.2 发展期 | 第17-20页 |
2.1.2.1 实用工具开发 | 第17-18页 |
2.1.2.2 应用领域拓展 | 第18-20页 |
2.1.3 国外研究小结 | 第20-21页 |
2.2 国内研究 | 第21-25页 |
2.2.1 期刊和学位论文 | 第21-24页 |
2.2.2 专著 | 第24-25页 |
2.2.3 国内研究小结 | 第25页 |
2.3 研究综述小结 | 第25-26页 |
3 人工辅助条件下基于规则的数据链接方法 | 第26-36页 |
3.1 人工参与实体识别的必要性 | 第26-29页 |
3.1.1 等价类与等价属性 | 第26-27页 |
3.1.2 等价带来的困扰 | 第27页 |
3.1.3 程序的局限 | 第27-28页 |
3.1.4 本部分的结论 | 第28-29页 |
3.2 人工辅助条件下的数据链接工作 | 第29-35页 |
3.2.1 概述 | 第29-30页 |
3.2.2 同质类和同质属性的处理 | 第30-31页 |
3.2.3 共指实体的识别 | 第31-35页 |
3.2.3.1 标识属性判定 | 第32-33页 |
3.2.3.2 推理判定 | 第33-34页 |
3.2.3.3 纯人工判定 | 第34-35页 |
3.3 数据链接的实现 | 第35-36页 |
4 实验系统的开发与运行 | 第36-54页 |
4.1 对象数据集的选取 | 第36-39页 |
4.2 系统功能描述 | 第39-54页 |
4.2.1 数据集架构分析 | 第39-42页 |
4.2.2 等价类的选择 | 第42-46页 |
4.2.3 标识属性的选择和规则的制定 | 第46-50页 |
4.2.4 实体识别 | 第50-54页 |
5 实验结果与分析 | 第54-60页 |
5.1 单一标识属性匹配结果与评估 | 第54-56页 |
5.2 组合标识属性匹配结果与评估 | 第56-57页 |
5.3 推理判定实验结果与评估 | 第57-60页 |
6 研究结论与展望 | 第60-63页 |
6.1 研究结论 | 第60-61页 |
6.2 本研究存在的不足 | 第61页 |
6.3 研究展望 | 第61-63页 |
参考文献 | 第63-68页 |
附录 | 第68-77页 |
致谢 | 第77页 |