基于统计与条件随机场的中文地名识别

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第10-16页
1.1 背景与意义	第10-11页
1.2 研究现状	第11-13页
1.2.1 语料库	第11-12页
1.2.3 常用方法	第12-13页
1.3 研究内容和创新点	第13-14页
1.3.1 本文研究内容	第13-14页
1.3.2 本文的创新点	第14页
1.4 内容安排	第14-16页
第二章相关研究	第16-25页
2.1 中文地名特征	第16-19页
2.1.1 地名通名和专名	第16-17页
2.1.2 简单地名和复杂地名	第17-18页
2.1.3 地名确定性	第18页
2.1.4 地名边界	第18页
2.1.5 地名歧义	第18-19页
2.2 语料库的选择与制作	第19-20页
2.2.1 语料库的选择	第19页
2.2.2 语料库制作的标准	第19-20页
2.3 统计知识	第20-24页
2.3.1 条件随机场	第20-22页
2.3.2 互信息与点互信息	第22-23页
2.3.3 信息熵	第23-24页
2.4 本章小结	第24-25页
第三章中文地名识别	第25-35页
3.1 基于条件随机场地名识别	第25-28页
3.1.1 中文地名标注模型	第25页
3.1.2 特征选择	第25-26页
3.1.3 特征模板	第26-27页
3.1.4 模型训练	第27-28页
3.2 基于规则的地名识别	第28-31页
3.2.1 规则选取	第29-30页
3.2.2 基于规则的探测窗口识别方法	第30-31页
3.3 基于信息熵和点互信息的复杂地名的识别	第31-34页
3.3.1 复杂地名用字关联性	第31-33页
3.3.2 复杂地名识别流程	第33-34页
3.4 本章小结	第34-35页
第四章实验结果与对比	第35-42页
4.1 实验方案	第35-37页
4.1.1 评测标准	第35页
4.1.2 语料库资源	第35-37页
4.1.3 特征模板的设计	第37页
4.2 实验结果分析	第37-41页
4.2.1 探测窗口规则与传统规则对比	第37-38页
4.2.2 复杂地名识别算法阈值训练	第38-40页
4.2.3 复杂地名识别对比试验	第40页
4.2.4 与现有模型识别效果的对比	第40-41页
4.3 本章小结	第41-42页
第五章总结与展望	第42-44页
5.1 研究工作总结	第42-43页
5.2 未来展望	第43-44页
参考文献	第44-46页
攻读硕士学位期间发表的论文	第46-47页
致谢	第47-48页