基于潜在语义分析与多特征融合的中文机构名识别

摘要	第4-5页
ABSTRACT	第5页
第一章绪论	第8-18页
1.1 研究背景与意义	第8-9页
1.2 研究的必要性与困难	第9-11页
1.2.1 研究的必要性	第9页
1.2.2 研究难点	第9-11页
1.3 中文机构名识别算法研究现状	第11-15页
1.4 本文主要研究内容	第15页
1.5 论文结构安排	第15-18页
第二章相关模型介绍	第18-32页
2.1 潜在狄利克雷分布	第18-22页
2.1.1 LDA模型概述	第18-19页
2.1.2 LDA模型参数估计	第19-21页
2.1.3 LDA文本建模	第21-22页
2.2 条件随机场模型	第22-30页
2.2.1 CRF模型概述	第22-24页
2.2.2 特征函数	第24-25页
2.2.3 CRF模型特征选择	第25-26页
2.2.4 数据序列标注	第26-28页
2.2.5 参数估计	第28-29页
2.2.6 CRF模型训练	第29-30页
2.3 本章小结	第30-32页
第三章基于潜在语义分析的序列标注方法	第32-38页
3.1 序列标注模块设计	第32-33页
3.2 CRF特征集	第33-34页
3.3 特征模板	第34-35页
3.4 CRF模型学习	第35-37页
3.5 本章小结	第37-38页
第四章基于潜在语义分析与多特征融合的机构名识别方法	第38-50页
4.1 中文机构名全程特征	第38-42页
4.1.1 中文机构名称的结构	第38-40页
4.1.2 中文机构名称的核心特征词	第40-41页
4.1.3 中文机构名称的左边界规则集	第41-42页
4.2 行为特征	第42-44页
4.3 中文机构名识别	第44-46页
4.4 排错模式特征	第46-47页
4.5 模型优化	第47-48页
4.6 本章小结	第48-50页
第五章系统设计及实验分析	第50-58页
5.1 中文机构名识别系统设计	第50-51页
5.2 实验设置	第51-53页
5.2.1 评测指标	第51-52页
5.2.2 实验语料	第52页
5.2.3 实验准备	第52-53页
5.3 实验结果与分析	第53-56页
5.3.1 实验设计	第53-54页
5.3.2 序列标注模块实验结果分析	第54页
5.3.3 机构名识别实验结果分析	第54-56页
5.4 本章小结	第56-58页
总结与展望	第58-60页
参考文献	第60-66页
攻读硕士学位期间取得的学术成果	第66-68页
致谢	第68页