古汉语编年体的人名实体识别与词性标注

中文摘要	第7-8页
Abstract	第8-9页
第一章绪论	第10-17页
1.1 现代汉语信息处理的研究介绍及现状概述	第12-14页
1.1.1 汉语分词	第12页
1.1.2 名词实体识别	第12-13页
1.1.3 姓名歧义区分	第13页
1.1.4 汉语语法分析	第13页
1.1.5 词语语境推测	第13-14页
1.2 研究古汉语信息处理的目的	第14-16页
1.2.1 古汉语信息处理研究缺乏	第14页
1.2.2 古汉语研究对现代汉语语法解析的启发	第14页
1.2.3 古汉语信息提取研究对其他学科的意义	第14-16页
1.3 论文内容和组织结构	第16-17页
第二章基于CRF模型的词性标注在古汉语语言处理中的应用	第17-34页
2.1 选择编年体作为研究语料	第17-19页
2.2 跳过分词进行词性标注	第19-20页
2.3 常用的序列标记算法	第20-23页
2.3.1 常见的序列模型比较	第20-21页
2.3.2 条件随机场模型中的特征	第21-22页
2.3.3 使用的算法框架以及三种图模型	第22-23页
2.4 实验分析与结果	第23-33页
2.4.1 数据集的制作	第23-24页
2.4.2 评估标准	第24-25页
2.4.3 专有名词识别实验结果与分析	第25-26页
2.4.4 人名识别实验结果与分析	第26页
2.4.5 词性标注实验结果与分析	第26-31页
2.4.6 CRF模型自动标注词性的机器识别错误分析	第31-33页
2.5 小结	第33-34页
第三章基于规则的编年体史料姓名实体抽取	第34-43页
3.1 使用规则识别编年体中的人名	第34-36页
3.1.1 古汉语不能套用现代汉语的规则	第34页
3.1.2 编年体中人名周边的规则	第34-36页
3.2 实验材料、规则列表以及算法实现	第36-39页
3.3 实验结果与分析	第39-42页
3.3.1 人名识别的精确率、召回率与F1值	第39-40页
3.3.2 方法不足之处	第40-42页
3.4 小结	第42-43页
第四章总结与展望	第43-46页
4.1 论文的主要成果	第43-44页
4.2 实验分析中存在的问题	第44-45页
4.3 展望	第45-46页
参考文献	第46-48页
致谢	第48-49页