摘要 | 第3-5页 |
Abstract | 第5-7页 |
第一章 绪论 | 第14-23页 |
1.1 研究背景及意义 | 第14-15页 |
1.2 相关研究现状 | 第15-22页 |
1.2.1 命名实体识别研究现状 | 第15-18页 |
1.2.1.1 基于规则的命名实体识别 | 第15-16页 |
1.2.1.2 基于机器学习的命名实体识别 | 第16-17页 |
1.2.1.3 基于神经网络的命名实体识别 | 第17-18页 |
1.2.2 藏文命名实体识别研究现状 | 第18-19页 |
1.2.3 主动学习的研究现状 | 第19-22页 |
1.2.3.1 主动学习算法简介 | 第19-21页 |
1.2.3.2 主动学习的应用 | 第21-22页 |
1.3 本文研究内容及组织结构 | 第22-23页 |
第二章 基于多特征的CRF藏文命名实体识别 | 第23-36页 |
2.1 引言 | 第23页 |
2.2 藏文命名实体特征研究 | 第23-26页 |
2.2.1 藏文命名实体识别常用特征 | 第23-24页 |
2.2.2 藏文人名特征 | 第24-25页 |
2.2.3 藏文命名实体的并列关系特征 | 第25-26页 |
2.3 基于多特征的CRF藏文命名实体识别研究 | 第26-32页 |
2.3.1 基于多特征的藏文人名识别 | 第26-29页 |
2.3.1.1 人名多特征标注说明 | 第26-27页 |
2.3.1.2 人名特征模板说明 | 第27-29页 |
2.3.2 基于后缀特征的藏文地名、组织机构名识别 | 第29-31页 |
2.3.3 基于并列关系的藏文命名实体识别 | 第31-32页 |
2.4 实验与分析 | 第32-35页 |
2.4.1 实验语料及评测指标 | 第32页 |
2.4.2 藏文人名的识别实验 | 第32-33页 |
2.4.3 藏文地名的识别实验 | 第33-34页 |
2.4.4 藏文组织机构名的识别实验 | 第34-35页 |
2.5 本章小结 | 第35-36页 |
第三章 基于主动学习的藏文命名实体识别模型 | 第36-50页 |
3.1 引言 | 第36-37页 |
3.2 基于置信度的主动学习方法 | 第37-39页 |
3.2.1 基于置信度主动学习的藏文命名实体识别模型 | 第37页 |
3.2.2 句子置信度的计算 | 第37-38页 |
3.2.3 基于置信度最低k的主动学习方法 | 第38-39页 |
3.2.4 基于置信度阈值的主动学习方法 | 第39页 |
3.3 基于多样性抽样的主动学习方法 | 第39-42页 |
3.3.1 基于多样性抽样主动学习的藏文命名实体识别模型 | 第39-40页 |
3.3.2 命名实体特征多样性的计算 | 第40-41页 |
3.3.3 基于命名实体特征多样性的主动学习方法 | 第41-42页 |
3.4 实验与分析 | 第42-48页 |
3.4.1 已标注语料的选择 | 第42页 |
3.4.2 实验语料 | 第42-43页 |
3.4.3 基于置信度选择的主动学习方法实验 | 第43-45页 |
3.4.3.1 基于置信度最低k的主动学习方法实验 | 第43-45页 |
3.4.3.2 基于置信度阈值的主动学习方法实验 | 第45页 |
3.4.4 基于多样性抽样的主动学习方法实验 | 第45-46页 |
3.4.5 监督式学习与主动学习对比实验 | 第46-48页 |
3.5 本章小结 | 第48-50页 |
第四章 结论与展望 | 第50-52页 |
参考文献 | 第52-57页 |
附录1 藏文命名实体特征列表 | 第57-59页 |
附录2 藏族人名特有上下文特征列表 | 第59-60页 |
致谢 | 第60-61页 |
攻读学位期间发表的学术论文目录 | 第61页 |
攻读学位期间主持的科研项目 | 第61页 |
攻读学位期间参与的科研项目 | 第61页 |