汉英双语语料库自动对齐研究
摘要 | 第1-5页 |
ABSTRACT | 第5-11页 |
第一章 引言 | 第11-23页 |
·自然语言处理技术的发展与应用 | 第11-12页 |
·语料库及双语语料库 | 第12-15页 |
·双语语料库中的对齐技术 | 第15-20页 |
·本文的研究 | 第20-23页 |
第二章 基本概念 | 第23-30页 |
·对齐的形式化定义 | 第23-25页 |
·对齐的评价方法 | 第25-29页 |
·本章小结 | 第29-30页 |
第三章 英语句边界辨识研究 | 第30-41页 |
·问题的提出 | 第30页 |
·问题的分析 | 第30-31页 |
·英语句边界的辨识 | 第31-40页 |
·前人的研究 | 第31-33页 |
·基于转换的错误驱动的学习 | 第33-34页 |
·句边界辨识规则的自动学习 | 第34-40页 |
·本章小结 | 第40-41页 |
第四章 汉英双语库分段对齐研究 | 第41-58页 |
·段落对齐 | 第41-42页 |
·分段对齐 | 第42-53页 |
·分段对齐锚点的选择 | 第42-44页 |
·基于翻译的源文词和译文词的相似性度量 | 第44-50页 |
·算法实现 | 第50-53页 |
·实验结果及分析 | 第53-57页 |
·本章小结 | 第57-58页 |
第五章 汉英双语库句子对齐研究 | 第58-74页 |
·句子对齐 | 第58-59页 |
·基于概率的句子对齐模型 | 第59-60页 |
·句子对齐的方法 | 第60-65页 |
·基于长度的句子对齐 | 第61-63页 |
·基于词汇信息的句子对齐 | 第63-65页 |
·长度和词汇信息相混和的方法 | 第65页 |
·汉英句子自动对齐 | 第65-73页 |
·汉英句子的统计实验 | 第66-68页 |
·汉英句子对齐的综合方法 | 第68-70页 |
·实验结果及分析 | 第70-73页 |
·本章小结 | 第73-74页 |
第六章 汉英双语库词汇对齐研究 | 第74-94页 |
·词汇对齐的难点 | 第74-76页 |
·汉英词汇对齐 | 第76-88页 |
·Brown的词汇对齐模型 | 第76-78页 |
·基于双语词典的词汇对齐 | 第78-80页 |
·基于语义相似度的词汇对齐 | 第80-83页 |
·位置变形距离 | 第83-86页 |
·汉英词汇对齐的扩充方法 | 第86-87页 |
·基于翻译共现概率的词汇对齐 | 第87-88页 |
·实验结果及分析 | 第88-92页 |
·词汇对齐实验 | 第88-91页 |
·词汇对齐错误分析 | 第91-92页 |
·本章小结 | 第92-94页 |
第七章 系统实现 | 第94-103页 |
·系统框架 | 第94-95页 |
·系统实现 | 第95-100页 |
·1 数据结构 | 第95-98页 |
·2 部分函数 | 第98-100页 |
·实验结果 | 第100-102页 |
·本章小结 | 第102-103页 |
第八章 结论及今后的工作 | 第103-106页 |
·总结 | 第103-104页 |
·今后的工作 | 第104-106页 |
参考文献 | 第106-119页 |
附录 | 第119-142页 |
附录一 汉语词性标注集 | 第119-120页 |
附录二 分布向量距离计算函数 | 第120-125页 |
附录三 分段对齐时部分输出词对 | 第125-126页 |
附录四 分段对齐输出的部分锚点句子 | 第126-131页 |
附录五 部分句子对齐的结果 | 第131-137页 |
附录六 《同义词词林》大类和中类的代码和分类名称 | 第137-139页 |
附录七 部分词汇对齐结果 | 第139-142页 |
作者简介 | 第142页 |