首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉英双语语料库自动对齐研究

摘要第1-5页
ABSTRACT第5-11页
第一章 引言第11-23页
   ·自然语言处理技术的发展与应用第11-12页
   ·语料库及双语语料库第12-15页
   ·双语语料库中的对齐技术第15-20页
   ·本文的研究第20-23页
第二章 基本概念第23-30页
   ·对齐的形式化定义第23-25页
   ·对齐的评价方法第25-29页
   ·本章小结第29-30页
第三章 英语句边界辨识研究第30-41页
   ·问题的提出第30页
   ·问题的分析第30-31页
   ·英语句边界的辨识第31-40页
     ·前人的研究第31-33页
     ·基于转换的错误驱动的学习第33-34页
     ·句边界辨识规则的自动学习第34-40页
   ·本章小结第40-41页
第四章 汉英双语库分段对齐研究第41-58页
   ·段落对齐第41-42页
   ·分段对齐第42-53页
     ·分段对齐锚点的选择第42-44页
     ·基于翻译的源文词和译文词的相似性度量第44-50页
     ·算法实现第50-53页
   ·实验结果及分析第53-57页
   ·本章小结第57-58页
第五章 汉英双语库句子对齐研究第58-74页
   ·句子对齐第58-59页
   ·基于概率的句子对齐模型第59-60页
   ·句子对齐的方法第60-65页
     ·基于长度的句子对齐第61-63页
     ·基于词汇信息的句子对齐第63-65页
     ·长度和词汇信息相混和的方法第65页
   ·汉英句子自动对齐第65-73页
     ·汉英句子的统计实验第66-68页
     ·汉英句子对齐的综合方法第68-70页
     ·实验结果及分析第70-73页
   ·本章小结第73-74页
第六章 汉英双语库词汇对齐研究第74-94页
   ·词汇对齐的难点第74-76页
   ·汉英词汇对齐第76-88页
     ·Brown的词汇对齐模型第76-78页
     ·基于双语词典的词汇对齐第78-80页
     ·基于语义相似度的词汇对齐第80-83页
     ·位置变形距离第83-86页
     ·汉英词汇对齐的扩充方法第86-87页
     ·基于翻译共现概率的词汇对齐第87-88页
   ·实验结果及分析第88-92页
     ·词汇对齐实验第88-91页
     ·词汇对齐错误分析第91-92页
   ·本章小结第92-94页
第七章 系统实现第94-103页
   ·系统框架第94-95页
   ·系统实现第95-100页
   ·1 数据结构第95-98页
   ·2 部分函数第98-100页
   ·实验结果第100-102页
   ·本章小结第102-103页
第八章 结论及今后的工作第103-106页
   ·总结第103-104页
   ·今后的工作第104-106页
参考文献第106-119页
附录第119-142页
 附录一 汉语词性标注集第119-120页
 附录二 分布向量距离计算函数第120-125页
 附录三 分段对齐时部分输出词对第125-126页
 附录四 分段对齐输出的部分锚点句子第126-131页
 附录五 部分句子对齐的结果第131-137页
 附录六 《同义词词林》大类和中类的代码和分类名称第137-139页
 附录七 部分词汇对齐结果第139-142页
作者简介第142页

论文共142页,点击 下载论文
上一篇:政治发展理论的序列观评析
下一篇:论中国城市化--兼论现行城市发展方针