可比语料中命名实体翻译等价对抽取方法研究
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-13页 |
| ·研究背景 | 第8-10页 |
| ·研究意义 | 第10页 |
| ·研究现状 | 第10-12页 |
| ·本文的工作 | 第12-13页 |
| 2 可比语料库命名实体翻译等价对抽取 | 第13-26页 |
| ·问题描述 | 第13-14页 |
| ·命名实体翻译等价对抽取系统 | 第14-16页 |
| ·难点分析 | 第16-17页 |
| ·相关模型 | 第17-26页 |
| ·统计机器翻译模型 | 第17-19页 |
| ·判别学习算法 | 第19-22页 |
| ·支持向量机模型 | 第22-26页 |
| 3 基于多特征的命名实体等价对抽取 | 第26-37页 |
| ·命名实体抽取 | 第26页 |
| ·中文命名实体抽取 | 第26页 |
| ·英文命名实体抽取 | 第26页 |
| ·特征选取 | 第26-36页 |
| ·音译模型特征 | 第27-29页 |
| ·翻译模型特征 | 第29-32页 |
| ·拼音串匹配特征 | 第32页 |
| ·词长度特征 | 第32-33页 |
| ·词的同现频率特征 | 第33-34页 |
| ·匹配模型特征 | 第34-36页 |
| ·命名实体翻译等价对计算模型 | 第36-37页 |
| 4 多特征的融合 | 第37-44页 |
| ·命名实体翻译等价对中判别学习定义 | 第37-38页 |
| ·基于MSR算法的多特征融合方法 | 第38-44页 |
| ·特征权重区间确定 | 第39-41页 |
| ·特征的选择 | 第41-42页 |
| ·基于MSR算法的权重计算方法 | 第42-44页 |
| 5 命名实体翻译等价对的对齐 | 第44-48页 |
| ·阈值限定 | 第44-45页 |
| ·基于SVM对齐模型 | 第45-48页 |
| ·特征的选择 | 第46页 |
| ·模型的训练 | 第46-47页 |
| ·模型的测试 | 第47-48页 |
| 6 实验与评估 | 第48-53页 |
| ·语料及评价方法 | 第48页 |
| ·实验 | 第48-52页 |
| ·各个特征作用 | 第49-50页 |
| ·多特征融合结果 | 第50-51页 |
| ·对齐模型结果 | 第51-52页 |
| ·实验总结 | 第52-53页 |
| 结论 | 第53-55页 |
| 参考文献 | 第55-59页 |
| 攻读硕士学位期间发表学术论文情况 | 第59-60页 |
| 致谢 | 第60-61页 |