首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉文—维吾尔文双语语料库构建的实验性研究

摘要第1-3页
ABSTRACT第3-6页
第一章 引言第6-13页
   ·本文研究的背景和意义第6-10页
     ·研究背景第6-8页
     ·研究意义第8-10页
   ·相关研究综述第10-11页
   ·本文的主要研究内容和组织第11-13页
第二章 汉维双语语料库总体结构第13-24页
   ·语料库文本的收集整理第14-16页
   ·语料库文本的加工第16-17页
   ·句子对齐技术描述第17-18页
   ·句子对齐的意义第18页
   ·句子对齐方法介绍第18-21页
     ·基于长度的句子对齐方法第19-20页
     ·基于词典译文的句子对齐方法第20页
     ·长度和词汇信息相结合的句子对齐方法第20-21页
   ·对齐的评价方法第21-23页
   ·本章小结第23-24页
第三章 汉维双语段落对齐和句子对齐定义第24-35页
   ·双语句子对齐的主要难点第24-25页
   ·句子对齐问题的描述第25-26页
   ·多层次分段对齐方法第26-32页
     ·分段对齐的必要性第27-28页
     ·基于回车符的分段对齐方法第28-29页
     ·基于数字信息的分段对齐方法第29页
     ·基本思路第29-32页
   ·句子对齐的形式化定义第32-34页
   ·本章小结第34-35页
第四章 汉维句子对齐算法思想第35-45页
   ·汉维平行语料长度关系统计第35-37页
   ·基于长度的句子对齐方法第37-39页
   ·基于词典译文的句子对齐方法第39-43页
     ·基于词典译文方法的算法设计第39-40页
     ·词汇互译率计算方法第40-41页
     ·基于词典译文的句子对齐评价函数第41-42页
     ·词汇覆盖率第42-43页
   ·句子对齐后处理思路第43-44页
   ·本章小节第44-45页
第五章 主要实现过程和实验结果第45-56页
   ·实验准备第45页
   ·主要数据结构第45-47页
   ·预处理模块的主要工作第47-49页
   ·多层次分段对齐模块的具体实现第49-50页
   ·基于词典译文的句子对齐模块的具体实现第50-53页
   ·实验结果第53-55页
     ·多层次分段对齐实验第53页
     ·基于长度的汉维句子对齐实验第53-54页
     ·基于词典译文的汉维句子对齐实验第54-55页
   ·本章小节第55-56页
第六章 结论和展望第56-58页
   ·本文的工作总结第56页
   ·今后的工作第56-58页
参考文献第58-61页
在学期间发表论文第61-62页
致谢第62-63页

论文共63页,点击 下载论文
上一篇:基于SSE-CMM的定量信息安全风险评估模型研究
下一篇:维吾尔文字联机手写体识别系统的研究与实现