首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于英汉平行语料库的命名实体对自动获取方法研究

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
目录第8-10页
图目录第10-11页
表目录第11-12页
1 绪论第12-17页
    1.1 研究背景和意义第12-13页
    1.2 国内外研究现状第13-15页
    1.3 论文的主要内容第15页
    1.4 论文的组织结构第15-17页
2 理论与技术基础第17-34页
    2.1 命名实体的基本概念和翻译特点第17-20页
        2.1.1 人名第18页
        2.1.2 地名第18-19页
        2.1.3 组织机构名第19-20页
        2.1.4 人名、地名和组织结构名的相互关系第20页
    2.2 现有的双语命名实体识别方法第20-26页
        2.2.1 单语命名实体识别方法第21-24页
        2.2.2 双语命名实体识别方法第24-26页
    2.3 统计机器翻译第26-31页
        2.3.1 基本原理和特点第26-27页
        2.3.2 IBM统计翻译模型第27-29页
        2.3.3 解码算法第29-31页
    2.4 最大熵模型第31-34页
        2.4.1 相关理论介绍第31页
        2.4.2 最大熵模型原理第31-34页
3 平行语料库中命名实体等价对的获取第34-43页
    3.1 问题描述第34页
    3.2 系统框架及分析第34-36页
    3.3 命名实体识别第36-37页
        3.3.1 中文命名实体识别第36页
        3.3.2 英文命名实体识别第36-37页
    3.4 特征选取第37-41页
        3.4.1 音译模型特征第37-39页
        3.4.2 翻译模型特征第39-41页
        3.4.3 同现频率特征第41页
        3.4.4 词长度特征第41页
    3.5 基于最大熵的对齐模型第41-43页
4 实验及分析第43-47页
    4.1 实验设置第43-44页
        4.1.1 实验语料第43页
        4.1.2 基线系统第43页
        4.1.3 实验环境第43-44页
        4.1.4 评测方法第44页
    4.2 实验结果及分析第44-47页
5 结论与展望第47-48页
参考文献第48-51页
作者简历及攻读硕士学位期间取得的研究成果第51-53页
学位论文数据集第53页

论文共53页,点击 下载论文
上一篇:基于Libgdx引擎的手机画图游戏开发
下一篇:曲库信息管理系统的设计与实现