实体识别关键技术的研究
摘要 | 第4-6页 |
ABSTRACT | 第6-8页 |
第1章 绪论 | 第15-31页 |
1.1 研究背景 | 第16页 |
1.2 研究现状及分析 | 第16-28页 |
1.2.1 实体识别的索引技术 | 第17-20页 |
1.2.2 元组对的比较技术 | 第20-24页 |
1.2.3 实体识别分类技术 | 第24-27页 |
1.2.4 现有工作的不足 | 第27-28页 |
1.3 本文的研究内容 | 第28-31页 |
1.3.1 基于图模型的实体识别 | 第29页 |
1.3.2 基于规则的实体识别 | 第29页 |
1.3.3 基于距离度量的实体识别 | 第29-30页 |
1.3.4 实体描述信息冲突评估 | 第30-31页 |
第2章 基于图模型的实体识别 | 第31-44页 |
2.1 引言 | 第31-32页 |
2.2 基于图模型的实体识别框架 | 第32-36页 |
2.2.1 框架介绍 | 第33-34页 |
2.2.2 局部的数据对象划分算法 | 第34-35页 |
2.2.3 EIF的例子 | 第35-36页 |
2.3 基于EIF的作者识别算法 | 第36-38页 |
2.3.1 作者名的归类算法 | 第37-38页 |
2.3.2 基于聚类技术的数据对象划分 | 第38页 |
2.4 实验评估 | 第38-43页 |
2.4.1 实验设置 | 第38-39页 |
2.4.2 在真实数据集上的实验结果 | 第39-40页 |
2.4.3 比较实验 | 第40-41页 |
2.4.4 参数实验 | 第41-43页 |
2.5 本章小结 | 第43-44页 |
第3章 基于规则的实体识别 | 第44-74页 |
3.1 引言 | 第44-47页 |
3.2 实体识别规则 | 第47-51页 |
3.2.1 实体识别规则的语法 | 第47-48页 |
3.2.2 实体识别规则的语义 | 第48-49页 |
3.2.3 ER规则集合的性质 | 第49-51页 |
3.3 实体识别规则的发现 | 第51-63页 |
3.3.1 规则发现问题 | 第52-56页 |
3.3.2 PR生成算法 | 第56-60页 |
3.3.3 NR生成算法 | 第60-62页 |
3.3.4 算法分析 | 第62-63页 |
3.4 基于规则的实体识别 | 第63-66页 |
3.5 规则的更新 | 第66-67页 |
3.6 实验评估 | 第67-73页 |
3.6.1 实验设置 | 第68-69页 |
3.6.2 比较实验 | 第69-70页 |
3.6.3 更新规则的作用 | 第70-71页 |
3.6.4 训练集大小和阈值的影响 | 第71页 |
3.6.5 效率和可扩展性 | 第71-73页 |
3.7 本章小结 | 第73-74页 |
第4章 基于距离度量的实体识别 | 第74-91页 |
4.1 引言 | 第74-76页 |
4.2 背景介绍 | 第76-78页 |
4.2.1 主成分分析法 | 第77-78页 |
4.2.2 大间隔最近邻学习算法 | 第78页 |
4.3 实体识别的度量学习 | 第78-85页 |
4.3.1 元组对上实体识别的度量学习 | 第79-82页 |
4.3.2 元组集合上实体识别的度量学习 | 第82-85页 |
4.4 基于距离度量的实体识别 | 第85-86页 |
4.5 实验评估 | 第86-90页 |
4.5.1 实验设置 | 第86-87页 |
4.5.2 实验结果 | 第87-90页 |
4.6 本章小结 | 第90-91页 |
第5章 对冗余元组中实体描述的冲突评估 | 第91-112页 |
5.1 引言 | 第91-93页 |
5.2 实体描述冲突模型 | 第93-94页 |
5.3 edc范围计算问题 | 第94-97页 |
5.3.1 四个基本运算符 | 第94-96页 |
5.3.2 计算复杂性 | 第96-97页 |
5.4 edc范围计算框架 | 第97-108页 |
5.4.1 Max Dec算法 | 第98-100页 |
5.4.2 Min Dec算法 | 第100页 |
5.4.3 Max Inc算法 | 第100-105页 |
5.4.4 Min Inc算法 | 第105-108页 |
5.5 实验评估 | 第108-111页 |
5.5.1 实验设置 | 第108-109页 |
5.5.2 实验有效性 | 第109页 |
5.5.3 参数的影响 | 第109-111页 |
5.5.4 实验效率 | 第111页 |
5.6 本章小结 | 第111-112页 |
结论 | 第112-114页 |
参考文献 | 第114-126页 |
攻读博士学位期间发表的论文及其他成果 | 第126-128页 |
致谢 | 第128-129页 |
个人简历 | 第129页 |