摘要 | 第3-5页 |
Abstract | 第5-7页 |
第1章 绪论 | 第16-35页 |
1.1 课题背景及意义 | 第16-20页 |
1.1.1 课题背景 | 第16-18页 |
1.1.2 课题意义 | 第18-20页 |
1.2 研究现状及分析 | 第20-31页 |
1.2.1 命名实体识别任务的定义 | 第20-21页 |
1.2.2 基于规则和词典的命名实体识别方法 | 第21页 |
1.2.3 基于有指导机器学习的命名实体识别方法 | 第21-23页 |
1.2.4 基于半指导机器学习的命名实体抽取方法 | 第23-24页 |
1.2.5 基于无指导机器学习的命名实体抽取方法 | 第24-25页 |
1.2.6 领域自适应的命名实体识别方法 | 第25-26页 |
1.2.7 开放域命名实体的类别获取 | 第26-30页 |
1.2.8 命名实体识别的评测方法和相关评测会议 | 第30-31页 |
1.3 命名实体识别的挑战与趋势 | 第31-32页 |
1.4 本文的研究内容及章节安排 | 第32-35页 |
第2章 基于双语平行语料的汉语命名实体训练语料自动构建 | 第35-55页 |
2.1 引言 | 第35-36页 |
2.2 相关工作 | 第36-38页 |
2.2.1 利用双语平行语料标注单语语料相关工作 | 第36-37页 |
2.2.2 利用其他资源标注语料相关工作 | 第37-38页 |
2.3 基于双语平行语料的命名实体训练数据生成 | 第38-44页 |
2.3.1 双语对齐与英语命名实体识别 | 第38-39页 |
2.3.2 汉语命名实体候选训练语料的生成 | 第39-40页 |
2.3.3 命名实体训练语料的筛选 | 第40-44页 |
2.3.4 与人工标注语料的融合 | 第44页 |
2.4 实验结果与分析 | 第44-54页 |
2.4.1 实验数据 | 第44-45页 |
2.4.2 对语料质量的直接评价 | 第45-46页 |
2.4.3 与人工语料的间接比较 | 第46-48页 |
2.4.4 语料融合与加权 | 第48-50页 |
2.4.5 各类命名实体的识别效果 | 第50页 |
2.4.6 语料规模与来源的影响 | 第50-52页 |
2.4.7 基于CRF模型的结果 | 第52-53页 |
2.4.8 错误分析 | 第53-54页 |
2.5 本章小结 | 第54-55页 |
第3章 基于自学习的开放域命名实体边界识别 | 第55-72页 |
3.1 引言 | 第55-56页 |
3.2 相关工作 | 第56-58页 |
3.2.1 自学习方法相关工作 | 第56-57页 |
3.2.2 命名实体识别的特征 | 第57-58页 |
3.3 基于自学习方法的命名实体边界识别 | 第58-66页 |
3.3.1 训练语料构建 | 第58-61页 |
3.3.2 基于自学习的开放域命名实体边界识别模型训练 | 第61-62页 |
3.3.3 边界识别模型的特征 | 第62-66页 |
3.4 实验结果与分析 | 第66-71页 |
3.4.1 实验数据 | 第66-67页 |
3.4.2 自学习置信度阈值的选取 | 第67页 |
3.4.3 命名实体边界识别模型对比 | 第67-69页 |
3.4.4 特征的影响 | 第69-71页 |
3.5 本章小结 | 第71-72页 |
第4章 基于多信息源的开放域命名实体类别获取 | 第72-90页 |
4.1 引言 | 第72-73页 |
4.2 相关工作 | 第73-76页 |
4.2.1 基于模式匹配的方法 | 第73-74页 |
4.2.2 基于词语分布相似度的方法 | 第74-75页 |
4.2.3 基于在线百科的方法 | 第75-76页 |
4.3 基于多信息源的开放域命名实体类别挖掘方法 | 第76-81页 |
4.3.1 基于多信息源的开放域命名实体类别候选抽取 | 第76-78页 |
4.3.2 开放域命名实体类别排序 | 第78-81页 |
4.4 实验结果与分析 | 第81-89页 |
4.4.1 实验数据 | 第81页 |
4.4.2 评价方法 | 第81-82页 |
4.4.3 开放域命名实体类别候选的覆盖率 | 第82-84页 |
4.4.4 对开放域命名实体类别排序的评价 | 第84-87页 |
4.4.5 特征的影响 | 第87-88页 |
4.4.6 各领域的结果 | 第88页 |
4.4.7 错误分析 | 第88-89页 |
4.5 本章小结 | 第89-90页 |
第5章 基于词汇分布表示的开放域命名实体类别层次化 | 第90-110页 |
5.1 引言 | 第90-91页 |
5.2 相关工作 | 第91-93页 |
5.2.1 语义层次化相关工作 | 第91-92页 |
5.2.2 词汇分布表示相关工作 | 第92-93页 |
5.3 基于词汇分布表示的命名实体类别层次化 | 第93-98页 |
5.3.1 问题定义 | 第93页 |
5.3.2 词汇分布表示的训练 | 第93-94页 |
5.3.3 上下位关系映射学习 | 第94-97页 |
5.3.4 上下位关系的判别 | 第97-98页 |
5.4 实验结果及分析 | 第98-106页 |
5.4.1 实验设置 | 第98-100页 |
5.4.2 聚类数目的影响 | 第100-101页 |
5.4.3 与前人工作的比较 | 第101-102页 |
5.4.4 在《同义词词林》外数据上的比较 | 第102-104页 |
5.4.5 错误分析和讨论 | 第104-106页 |
5.5 《大词林》系统介绍 | 第106-109页 |
5.6 本章小结 | 第109-110页 |
结论 | 第110-113页 |
参考文献 | 第113-126页 |
攻读博士学位期间发表的论文及其他成果 | 第126-128页 |
致谢 | 第128-130页 |
个人简历 | 第130-131页 |