| 中文摘要 | 第7-8页 |
| Abstract | 第8-9页 |
| 第一章 绪论 | 第10-17页 |
| 1.1 现代汉语信息处理的研究介绍及现状概述 | 第12-14页 |
| 1.1.1 汉语分词 | 第12页 |
| 1.1.2 名词实体识别 | 第12-13页 |
| 1.1.3 姓名歧义区分 | 第13页 |
| 1.1.4 汉语语法分析 | 第13页 |
| 1.1.5 词语语境推测 | 第13-14页 |
| 1.2 研究古汉语信息处理的目的 | 第14-16页 |
| 1.2.1 古汉语信息处理研究缺乏 | 第14页 |
| 1.2.2 古汉语研究对现代汉语语法解析的启发 | 第14页 |
| 1.2.3 古汉语信息提取研究对其他学科的意义 | 第14-16页 |
| 1.3 论文内容和组织结构 | 第16-17页 |
| 第二章 基于CRF模型的词性标注在古汉语语言处理中的应用 | 第17-34页 |
| 2.1 选择编年体作为研究语料 | 第17-19页 |
| 2.2 跳过分词进行词性标注 | 第19-20页 |
| 2.3 常用的序列标记算法 | 第20-23页 |
| 2.3.1 常见的序列模型比较 | 第20-21页 |
| 2.3.2 条件随机场模型中的特征 | 第21-22页 |
| 2.3.3 使用的算法框架以及三种图模型 | 第22-23页 |
| 2.4 实验分析与结果 | 第23-33页 |
| 2.4.1 数据集的制作 | 第23-24页 |
| 2.4.2 评估标准 | 第24-25页 |
| 2.4.3 专有名词识别实验结果与分析 | 第25-26页 |
| 2.4.4 人名识别实验结果与分析 | 第26页 |
| 2.4.5 词性标注实验结果与分析 | 第26-31页 |
| 2.4.6 CRF模型自动标注词性的机器识别错误分析 | 第31-33页 |
| 2.5 小结 | 第33-34页 |
| 第三章 基于规则的编年体史料姓名实体抽取 | 第34-43页 |
| 3.1 使用规则识别编年体中的人名 | 第34-36页 |
| 3.1.1 古汉语不能套用现代汉语的规则 | 第34页 |
| 3.1.2 编年体中人名周边的规则 | 第34-36页 |
| 3.2 实验材料、规则列表以及算法实现 | 第36-39页 |
| 3.3 实验结果与分析 | 第39-42页 |
| 3.3.1 人名识别的精确率、召回率与F1值 | 第39-40页 |
| 3.3.2 方法不足之处 | 第40-42页 |
| 3.4 小结 | 第42-43页 |
| 第四章 总结与展望 | 第43-46页 |
| 4.1 论文的主要成果 | 第43-44页 |
| 4.2 实验分析中存在的问题 | 第44-45页 |
| 4.3 展望 | 第45-46页 |
| 参考文献 | 第46-48页 |
| 致谢 | 第48-49页 |