西里尔蒙古文—汉文机器翻译系统的实现
中文摘要 | 第1-7页 |
Abstract | 第7-9页 |
摘要 | 第9-17页 |
第一章 引言 | 第17-38页 |
·研究背景 | 第17-20页 |
·论文选题意义 | 第20-24页 |
·蒙古语的发展现状 | 第20-21页 |
·蒙汉机器翻译的难点 | 第21-24页 |
·国内外研究状况 | 第24-29页 |
·国内机器翻译研究 | 第24-26页 |
·机器翻译发展历史 | 第26-27页 |
·国内其他少数民族机器翻译研究 | 第27-29页 |
·主要研究工作及研究基础 | 第29-35页 |
·研究意义和方法 | 第35-38页 |
·研究意义 | 第35页 |
·研究方法 | 第35-38页 |
第二章 面向机器翻译的双语语料库建设 | 第38-73页 |
·收集语料库与字符提取 | 第38-50页 |
·平行语料库的界定及国内外平行语料库 | 第38页 |
·建立蒙汉平行语料库 | 第38-41页 |
·语料库的获取及句子对齐 | 第41-50页 |
·语料库预处理 | 第50-56页 |
·标准字符转换 | 第50-51页 |
·标点符号的处理 | 第51-52页 |
·西里尔蒙古文语料库中缩略语的处理 | 第52-54页 |
·大小写转换规则 | 第54-55页 |
·语料库预处理 | 第55-56页 |
·西里尔蒙古文的形态分析 | 第56-71页 |
·蒙古语的构形特征 | 第59-61页 |
·名词的复数附加成分缀接其他形式 | 第61-63页 |
·名词反身领属附加成分后缀接其他形式 | 第63页 |
·名词附属附加成分缀接其他形式 | 第63-65页 |
·否定虚词-ΓYй后缀接其他形式 | 第65-66页 |
·名词的格附加成分后缀接其他形式 | 第66-71页 |
·连写的三个或三个以上构形附加成分 | 第71页 |
·蒙汉双语词典 | 第71-73页 |
第三章 西里尔蒙古文命名实体识别 | 第73-95页 |
·西里尔蒙古文数词、时间词的识别 | 第73-83页 |
·蒙古文数词 | 第73-75页 |
·数词组成规律 | 第75-77页 |
·数词的识别 | 第77-78页 |
·时间词的识别 | 第78-79页 |
·数词的翻译 | 第79-82页 |
·数词时间词翻译总结分析 | 第82-83页 |
·人名的识别 | 第83-90页 |
·人名的特点 | 第83-84页 |
·人名的识别及音译 | 第84-90页 |
·地名的识别 | 第90-93页 |
·地名识别中词典的使用 | 第91-92页 |
·地名的识别 | 第92-93页 |
·特殊情况的处理 | 第93页 |
·语料库中命名实体的标注规范 | 第93-95页 |
第四章 蒙汉机器翻译基础 | 第95-102页 |
·机器翻译的模型 | 第95-96页 |
·基于短语的统计机器翻译方法 | 第96-98页 |
·翻译过程 | 第98-99页 |
·机器翻译的自动测评标准 | 第99-102页 |
第五章 西里尔蒙古文-汉文机器翻译实验和结果分析 | 第102-109页 |
·运行环境以及相关开源工具 | 第102页 |
·运行环境 | 第102页 |
·开源工具 | 第102页 |
·系统的整体框架 | 第102-104页 |
·蒙汉统计机器翻译系统 | 第104-106页 |
·实验数据 | 第104页 |
·语料库预处理 | 第104-105页 |
·语言模型的训练 | 第105页 |
·解码 | 第105-106页 |
·实验结果及分析 | 第106页 |
·总结与展望 | 第106-109页 |
参考文献 | 第109-115页 |
附录1:西里尔蒙古文-汉文双语平行语料库示例 | 第115-122页 |
附录2:西里尔蒙古文-传统蒙古文-汉文人名示例 | 第122-123页 |
附录3:西里尔蒙古文-汉文地名示例 | 第123-125页 |
附录4:西里尔蒙古文命名实体标注语料示例 | 第125-127页 |
附录5:缩略语转换表示例 | 第127-128页 |
附录6:数词、时间词识别与翻译规则表 | 第128-129页 |
致谢 | 第129页 |