基于英汉平行语料库的命名实体对自动获取方法研究

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7页
目录	第8-10页
图目录	第10-11页
表目录	第11-12页
1 绪论	第12-17页
1.1 研究背景和意义	第12-13页
1.2 国内外研究现状	第13-15页
1.3 论文的主要内容	第15页
1.4 论文的组织结构	第15-17页
2 理论与技术基础	第17-34页
2.1 命名实体的基本概念和翻译特点	第17-20页
2.1.1 人名	第18页
2.1.2 地名	第18-19页
2.1.3 组织机构名	第19-20页
2.1.4 人名、地名和组织结构名的相互关系	第20页
2.2 现有的双语命名实体识别方法	第20-26页
2.2.1 单语命名实体识别方法	第21-24页
2.2.2 双语命名实体识别方法	第24-26页
2.3 统计机器翻译	第26-31页
2.3.1 基本原理和特点	第26-27页
2.3.2 IBM统计翻译模型	第27-29页
2.3.3 解码算法	第29-31页
2.4 最大熵模型	第31-34页
2.4.1 相关理论介绍	第31页
2.4.2 最大熵模型原理	第31-34页
3 平行语料库中命名实体等价对的获取	第34-43页
3.1 问题描述	第34页
3.2 系统框架及分析	第34-36页
3.3 命名实体识别	第36-37页
3.3.1 中文命名实体识别	第36页
3.3.2 英文命名实体识别	第36-37页
3.4 特征选取	第37-41页
3.4.1 音译模型特征	第37-39页
3.4.2 翻译模型特征	第39-41页
3.4.3 同现频率特征	第41页
3.4.4 词长度特征	第41页
3.5 基于最大熵的对齐模型	第41-43页
4 实验及分析	第43-47页
4.1 实验设置	第43-44页
4.1.1 实验语料	第43页
4.1.2 基线系统	第43页
4.1.3 实验环境	第43-44页
4.1.4 评测方法	第44页
4.2 实验结果及分析	第44-47页
5 结论与展望	第47-48页
参考文献	第48-51页
作者简历及攻读硕士学位期间取得的研究成果	第51-53页
学位论文数据集	第53页