首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉柬命名实体翻译等价对获取方法研究

摘要第5-6页
Abstract第6-7页
第一章 绪论第11-19页
    1.1 研究背景及意义第11-13页
    1.2 国内外研究现状第13-17页
        1.2.1 通过翻译方法获取实体翻译等价对第13-14页
        1.2.2 从互联网中挖掘双语实体等价对第14-15页
        1.2.3 从文本语料中获取实体翻译等价对第15-17页
    1.3 本文的研究内容第17-18页
    1.4 论文的组织第18-19页
第二章 基于维基百科的汉柬命名实体翻译等价对抽取第19-25页
    2.1 引言第19页
    2.2 维基百科介绍第19-20页
    2.3 维基百科页面结构分析第20-21页
    2.4 基于维基百科内部链接的汉柬命名实体等价对抽取第21-22页
    2.5 实验结果与分析第22-24页
    2.6 本章小结第24-25页
第三章 柬-汉音译模型构建第25-43页
    3.1 引言第25页
    3.2 条件随机场模型第25-29页
        3.2.1 生成模型和判别模型第25-26页
        3.2.2 条件随机场理论基础第26-28页
        3.2.3 条件随机场模型的参数估计第28-29页
        3.2.4 条件随机场的特点第29页
    3.3 最大熵模型第29-32页
        3.3.1 最大熵理论基础第30-31页
        3.3.2 最大熵模型的优缺点第31-32页
    3.4 音译单元对齐第32页
    3.5 基于机器学习的音译方法第32-34页
    3.6 柬-汉人名音译模型构建第34-37页
        3.6.1 音译单元切分标注第34-36页
        3.6.2 音译单元翻译标注第36-37页
    3.7 实验结果与分析第37-41页
        3.7.1 实验数据及工具来源第37-38页
        3.7.2 实验及实验结果分析第38-41页
    3.8 本章小结第41-43页
第四章 基于特征相似度的可比语料挖掘汉柬命名实体等价对第43-59页
    4.1 引言第43页
    4.2 挖掘框架第43-45页
    4.3 特征相似度计算第45-51页
        4.3.1 音译特征第45-46页
        4.3.2 翻译特征第46-47页
        4.3.3 上下文词向量特征第47-50页
        4.3.4 长度特征第50-51页
    4.4 汉柬双语实体等价对相似度计算第51-53页
    4.5 实验及实验结果分析第53-57页
        4.5.1 评价方法第53页
        4.5.2 语料第53-54页
        4.5.3 实验第54-56页
        4.5.4 实验结果分析第56-57页
    4.6 本章小结第57-59页
第五章 汉柬命名实体等价对抽取原型系统第59-67页
    5.1 引言第59页
    5.2 系统框架第59页
    5.3 维基百科数据抽取模块第59-61页
        5.3.1 抽取参数设置第60页
        5.3.2 抽取效果第60-61页
    5.4 人名、地名翻译模块第61-63页
        5.4.1 语料标注第61-62页
        5.4.2 特征模板定义第62-63页
        5.4.3 翻译效果实现第63页
    5.5 命名实体查询模块第63-64页
    5.6 可比语料抽取模块第64-65页
    5.7 本章小结第65-67页
第六章 总结与展望第67-71页
    6.1 引言第67页
    6.2 工作总结第67-68页
    6.3 工作展望第68-71页
致谢第71-73页
参考文献第73-79页
附录A 攻读硕士期间发表论文与申请软件著作权第79-81页
附录B 攻读硕士期间参与项目第81页

论文共81页,点击 下载论文
上一篇:苏帕河水电开发有限公司物资管理系统的研究与分析
下一篇:基于不确定数据中析取规则的挖掘优化研究