首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

基于转换表及上下文环境的汉语简繁文本双向翻译

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第11-14页
    1.1 研究背景第11页
    1.2 研究目的第11-12页
    1.3 研究内容第12页
    1.4 研究成果第12-13页
    1.5 本文结构第13-14页
第二章 相关研究第14-26页
    2.1 研究背景第14-17页
        2.1.1 建国后的汉字简化第14-16页
        2.1.2 汉字简化所引起的问题第16-17页
    2.2 简繁转换问题第17-21页
        2.2.1 一对多简繁关系第17-19页
        2.2.2 两岸术语词的差异第19-21页
    2.3 相关研究第21-25页
    2.4 本章小结第25-26页
第三章 简繁转换流程及模型第26-41页
    3.1 简繁汉字转换流程第26-27页
    3.2 简繁汉字转换模型第27-32页
        3.2.1 一对多简繁分类组合模型第28-29页
        3.2.2 文本分词算法第29-31页
        3.2.3 文本分类算法第31-32页
    3.3 分类模型第32-40页
        3.3.1 SVM分类模型第32-36页
        3.3.2 最大熵分类模型第36-39页
        3.3.3Bayes分类模型第39-40页
        3.3.4 tf-idf第40页
    3.4 本章小结第40-41页
第四章 特征选择算法第41-47页
    4.1 信息增益法(Information Gain)第41-42页
    4.2 期望交叉熵(Expected Cross Entropy)第42页
    4.3 互信息(Mutual Information)第42-43页
    4.4 χ~2检验法第43-45页
    4.5 文本证据权(The Weight of Evidence for Text)第45-46页
    4.6 ADMMR优势值 (Absolute Difference of Max-Min Ratios)第46页
    4.7 本章小结第46-47页
第五章 数据准备第47-52页
    5.1 机器学习平行语料抽取第47-50页
        5.1.1 维基百科简介第47-49页
        5.1.2 Http Client与Html Parser第49页
        5.1.3 字词上下文抽取第49-50页
    5.2 简繁词库数据抽取第50-51页
        5.2.1 MDict及《台灣國語辭典》介绍第50-51页
        5.2.2 词典数据提取第51页
    5.3 本章小结第51-52页
第六章 实验结果第52-61页
    6.1 ADMMR特征选择实验第52-54页
    6.2 最大熵模型之tf-idf第54-55页
    6.3 SVM、Max Ent以及Bayes组合模型第55-58页
    6.4 规则加组合统计模型实验第58-60页
    6.5 本章小结第60-61页
第七章 总结第61-62页
参考文献第62-64页
致谢第64-65页
附录A 攻读学位期间所发表的学术论文目录第65-67页

论文共67页,点击 下载论文
上一篇:基于蓝噪声理论的多特征遥感图像森林植被纹理分割
下一篇:融合空间信息传播机制的背景差分方法研究