首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于潜在语义分析与多特征融合的中文机构名识别

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-18页
    1.1 研究背景与意义第8-9页
    1.2 研究的必要性与困难第9-11页
        1.2.1 研究的必要性第9页
        1.2.2 研究难点第9-11页
    1.3 中文机构名识别算法研究现状第11-15页
    1.4 本文主要研究内容第15页
    1.5 论文结构安排第15-18页
第二章 相关模型介绍第18-32页
    2.1 潜在狄利克雷分布第18-22页
        2.1.1 LDA模型概述第18-19页
        2.1.2 LDA模型参数估计第19-21页
        2.1.3 LDA文本建模第21-22页
    2.2 条件随机场模型第22-30页
        2.2.1 CRF模型概述第22-24页
        2.2.2 特征函数第24-25页
        2.2.3 CRF模型特征选择第25-26页
        2.2.4 数据序列标注第26-28页
        2.2.5 参数估计第28-29页
        2.2.6 CRF模型训练第29-30页
    2.3 本章小结第30-32页
第三章 基于潜在语义分析的序列标注方法第32-38页
    3.1 序列标注模块设计第32-33页
    3.2 CRF特征集第33-34页
    3.3 特征模板第34-35页
    3.4 CRF模型学习第35-37页
    3.5 本章小结第37-38页
第四章 基于潜在语义分析与多特征融合的机构名识别方法第38-50页
    4.1 中文机构名全程特征第38-42页
        4.1.1 中文机构名称的结构第38-40页
        4.1.2 中文机构名称的核心特征词第40-41页
        4.1.3 中文机构名称的左边界规则集第41-42页
    4.2 行为特征第42-44页
    4.3 中文机构名识别第44-46页
    4.4 排错模式特征第46-47页
    4.5 模型优化第47-48页
    4.6 本章小结第48-50页
第五章 系统设计及实验分析第50-58页
    5.1 中文机构名识别系统设计第50-51页
    5.2 实验设置第51-53页
        5.2.1 评测指标第51-52页
        5.2.2 实验语料第52页
        5.2.3 实验准备第52-53页
    5.3 实验结果与分析第53-56页
        5.3.1 实验设计第53-54页
        5.3.2 序列标注模块实验结果分析第54页
        5.3.3 机构名识别实验结果分析第54-56页
    5.4 本章小结第56-58页
总结与展望第58-60页
参考文献第60-66页
攻读硕士学位期间取得的学术成果第66-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:基于改进信噪比估计的相关谱衰减法研究
下一篇:基于内存信息隐藏的Android应用程序保护方法研究与设计