首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉老双语命名实体识别及对齐方法研究

摘要第5-7页
Abstract第7-8页
第一章 绪论第13-19页
    1.1 研究背景及意义第13-14页
    1.2 国内外研究现状第14-17页
        1.2.1 命名实体识别第14-15页
        1.2.2 命名实体对齐第15-17页
    1.3 论文的研究内容第17-18页
    1.4 论文的组织结构第18-19页
第二章 老挝语实体特征及相关问题概述第19-29页
    2.1 老挝语实体特征第19-21页
        2.1.1 老挝语人名特征第19页
        2.1.2 老挝语地名特征第19页
        2.1.3 老挝语组织机构名特征第19-20页
        2.1.4 老挝语人名、地名和组织机构名指示词第20-21页
    2.2 条件随机场模型第21-23页
        2.2.1 条件随机场模型简述第21页
        2.2.2 条件随机场的模型定义第21-22页
        2.2.3 条件随机场的条件概率计算第22-23页
    2.3 支持向量机模型第23-25页
        2.3.1 支持向量机模型简述第23页
        2.3.2 最优分类超平面第23-24页
        2.3.3 线性分类和线性不可分第24-25页
    2.4 词向量第25-28页
        2.4.1 词向量概述第25页
        2.4.2 词向量训练第25-27页
        2.4.3 K-means聚类第27-28页
    2.5 本章小结第28-29页
第三章 融入词向量特征的CRF老挝语命名实体识别研究第29-41页
    3.1 引言第29-30页
    3.2 融入词向量的CRF老挝语命名实体识别第30-34页
        3.2.1 词向量特征第30-32页
        3.2.2 改进的加权词向量第32-33页
        3.2.3 融入词向量特征的CRF识别模型第33-34页
    3.3 融入词向量聚类的CRF老挝语命名实体识别第34-37页
    3.4 实验第37-39页
        3.4.1 数据集与评价指标第37-38页
        3.4.2 实验结果第38-39页
    3.5 本章小结第39-41页
第四章 融合多特征的汉老双语命名实体对齐研究第41-55页
    4.1 引言第41页
    4.2 对齐框架第41-43页
    4.3 特征选取第43-47页
        4.3.1 音译模型特征第44-45页
        4.3.2 翻译模型特征第45-46页
        4.3.3 互信息特征第46页
        4.3.4 同现频率特征第46-47页
    4.4 汉老命名实体相似度计算第47-48页
    4.5 命名实体等价对的对齐第48-50页
        4.5.1 阈值限定第48页
        4.5.2 融入多特征的SVM对齐模型第48-50页
    4.6 实验第50-52页
        4.6.1 语料及评价方法第50-51页
        4.6.2 实验结果及分析第51-52页
    4.7 本章小结第52-55页
第五章 汉老命名实体翻译原型系统第55-61页
    5.1 引言第55页
    5.2 系统概述第55-56页
    5.3 汉老双语命名实体词典构建第56-58页
        5.3.1 语料获取及预处理第56-57页
        5.3.2 构建词典第57-58页
    5.4 汉老命名实体翻译系统实现第58-59页
    5.5 小结第59-61页
第六章 总结与展望第61-63页
    6.1 总结第61-62页
    6.2 展望第62-63页
致谢第63-65页
参考文献第65-71页
附录A (攻读学位期间发表著作和科研情况)第71-73页
附录B 攻读硕士期间参与项目第73页

论文共73页,点击 下载论文
上一篇:老挝语人名、地名及机构名识别研究
下一篇:脑卒中临床数据管理与疾病辅助预测系统