首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

基于机器翻译模型的汉语近音错别字校对方法研究

中文摘要第3-5页
Abstract第5-6页
第1章 绪论第10-18页
    1.1 研究目的和意义第10页
    1.2 国内外相关研究第10-15页
        1.2.1 错别字校对研究现状第10-12页
        1.2.2 机器翻译研究现状第12-13页
        1.2.3 神经网络研究现状第13-15页
    1.3 本文主要研究内容第15-17页
    1.4 本文的组织安排第17-18页
第2章 基于汉字-拼音-汉字转换的近音错别字语料库构造第18-35页
    2.1 引言第18-19页
    2.2 人工近音错别字语料库构造系统框架第19-21页
    2.3 基于模糊拼音的错字候选集构造第21-26页
        2.3.1 音素资源库构造第21-24页
        2.3.2 拼音-汉字语料库构造第24-25页
        2.3.3 错字候选集构造第25-26页
    2.4 语言模型解码第26-29页
        2.4.1 N元语言模型第26-27页
        2.4.2 训练语言模型第27-28页
        2.4.3 错字候选解码第28-29页
    2.5 神经网络最大熵过滤第29-32页
        2.5.1 神经网络最大熵模型第29-30页
        2.5.2 正字-错字对过滤问题第30-31页
        2.5.3 神经网络最大熵特征选取第31-32页
    2.6 实验数据第32-34页
        2.6.1 模糊拼音策略第32-33页
        2.6.2 N元语言模型策略第33页
        2.6.3 神经网络最大熵过滤策略第33-34页
    2.7 本章小结第34-35页
第3章 基于统计机器翻译的近音错别字校对第35-49页
    3.1 引言第35-36页
    3.2 基于统计机器翻译的近音错字校对系统框架第36-37页
    3.3 词对齐处理第37-38页
    3.4 错别字校对的语言模型第38-39页
    3.5 错别字校对的翻译模型第39页
    3.6 实验结果与分析第39-48页
        3.6.1 实验数据和评价指标第40-41页
        3.6.2 不同构造近音错别字语料库策略对近音错别字校对的影响第41-46页
        3.6.3 统计机器翻译模型本身对近音错别字校对的影响第46-47页
        3.6.4 实验对比第47-48页
    3.7 本章小结第48-49页
第4章 基于神经网络的机器翻译近音错别字校对第49-67页
    4.1 引言第49页
    4.2 基于神经网络的机器翻译近音错别字校对系统框架第49-52页
    4.3 神经网络模型第52-57页
        4.3.1 循环神经网络模型第52-55页
        4.3.2 长短时记忆网络模型第55-57页
    4.4 基于神经网络的机器翻译模型校对近音错别字第57-59页
        4.4.1 基于神经网络机器翻译模型策略第58页
        4.4.2 统计机器翻译框架结合神经网络语言模型的策略第58-59页
    4.5 实验结果与分析第59-66页
        4.5.1 实验数据和评价指标第59-60页
        4.5.2 神经网络机器翻译模型的近音错别字校对参数优化第60-61页
        4.5.3 统计机器翻译框架结合神经网络语言模型的参数优化第61-65页
        4.5.4 不同校对方法的对比实验第65-66页
    4.6 本章小结第66-67页
结论第67-69页
参考文献第69-74页
致谢第74-75页
攻读硕士学位期间发表的学术论文及参加的科研项目第75-76页

论文共76页,点击 下载论文
上一篇:基于文本语义正则约束的突发事件时间摘要技术研究
下一篇:基于异构存储的HDFS副本选择与管理策略研究