首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

从可比语料中抽取等价实体翻译对的研究

摘要第4-5页
Abstract第5页
第1章 绪论第8-21页
    1.1 课题背景及研究意义第8-9页
    1.2 国内外研究现状第9-19页
        1.2.1 基于音译的名实体翻译方法第9-11页
        1.2.2 从平行语料中抽取等价实体翻译对第11-12页
        1.2.3 从可比语料中抽取等价实体翻译对第12-19页
    1.3 本文的主要内容和组织结构第19-21页
第2章 用于抽取实体对的种子词典自适应第21-33页
    2.1 引言第21-22页
    2.2 BASELINE 系统的实现第22-24页
    2.3 种子词典的自适应方法第24-28页
        2.3.1 使用自分词方法进行自适应第24-25页
        2.3.2 种子词典的权重分配方法第25-28页
    2.4 实验结果及分析第28-32页
        2.4.1 实验语料第28页
        2.4.2 评价指标第28-29页
        2.4.3 Baseline 的选取第29-30页
        2.4.4 自适应实验第30-31页
        2.4.5 权重分配实验第31-32页
    2.5 本章小结第32-33页
第3章 针对实体对抽取的翻译信息压缩方法第33-54页
    3.1 引言第33-34页
    3.2 翻译信息的压缩方法第34-45页
        3.2.1 建立分布式词向量第34-42页
        3.2.2 计算单词之间的距离第42-43页
        3.2.3 同义词聚类第43页
        3.2.4 使用聚类结果对向量空间进行压缩第43-44页
        3.2.5 其他参数的含义及选择第44-45页
    3.3 实验结果及分析第45-53页
        3.3.1 种子词典压缩效果实验第45-48页
        3.3.2 压缩程度讨论第48-49页
        3.3.3 地名实体实验验证第49-51页
        3.3.4 使用多级阈值进行压缩第51-53页
    3.4 本章小结第53-54页
第4章 扩充种子词典覆盖率的研究第54-61页
    4.1 引言第54页
    4.2 种子词典扩充方法第54-57页
        4.2.1 高关联度词的获取第55-56页
        4.2.2 使用高关联度词进行扩充第56页
        4.2.3 区别词性信息的扩充第56-57页
    4.3 实验结果及分析第57-60页
        4.3.1 种子词典扩充的实验第57-58页
        4.3.2 限制扩充范围第58-59页
        4.3.3 词性信息对扩充的影响第59-60页
    4.4 本章小结第60-61页
结论第61-63页
参考文献第63-69页
攻读硕士学位期间发表的论文及其它成果第69-71页
致谢第71-72页
附录第72-85页
    附录一 500 个测试人名标准翻译第72-80页
    附录二 300 个测试地名标准翻译第80-85页

论文共85页,点击 下载论文
上一篇:Bussgang盲反卷积算法及其应用研究
下一篇:LCD偏光膜贴附缺陷检测的嵌入式图像处理系统设计