可比语料中命名实体翻译等价对抽取方法研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
1 绪论 | 第8-13页 |
·研究背景 | 第8-10页 |
·研究意义 | 第10页 |
·研究现状 | 第10-12页 |
·本文的工作 | 第12-13页 |
2 可比语料库命名实体翻译等价对抽取 | 第13-26页 |
·问题描述 | 第13-14页 |
·命名实体翻译等价对抽取系统 | 第14-16页 |
·难点分析 | 第16-17页 |
·相关模型 | 第17-26页 |
·统计机器翻译模型 | 第17-19页 |
·判别学习算法 | 第19-22页 |
·支持向量机模型 | 第22-26页 |
3 基于多特征的命名实体等价对抽取 | 第26-37页 |
·命名实体抽取 | 第26页 |
·中文命名实体抽取 | 第26页 |
·英文命名实体抽取 | 第26页 |
·特征选取 | 第26-36页 |
·音译模型特征 | 第27-29页 |
·翻译模型特征 | 第29-32页 |
·拼音串匹配特征 | 第32页 |
·词长度特征 | 第32-33页 |
·词的同现频率特征 | 第33-34页 |
·匹配模型特征 | 第34-36页 |
·命名实体翻译等价对计算模型 | 第36-37页 |
4 多特征的融合 | 第37-44页 |
·命名实体翻译等价对中判别学习定义 | 第37-38页 |
·基于MSR算法的多特征融合方法 | 第38-44页 |
·特征权重区间确定 | 第39-41页 |
·特征的选择 | 第41-42页 |
·基于MSR算法的权重计算方法 | 第42-44页 |
5 命名实体翻译等价对的对齐 | 第44-48页 |
·阈值限定 | 第44-45页 |
·基于SVM对齐模型 | 第45-48页 |
·特征的选择 | 第46页 |
·模型的训练 | 第46-47页 |
·模型的测试 | 第47-48页 |
6 实验与评估 | 第48-53页 |
·语料及评价方法 | 第48页 |
·实验 | 第48-52页 |
·各个特征作用 | 第49-50页 |
·多特征融合结果 | 第50-51页 |
·对齐模型结果 | 第51-52页 |
·实验总结 | 第52-53页 |
结论 | 第53-55页 |
参考文献 | 第55-59页 |
攻读硕士学位期间发表学术论文情况 | 第59-60页 |
致谢 | 第60-61页 |