第一章 引言 | 第1-12页 |
1.1 研究目标 | 第7-8页 |
1.2 组合型歧义的分布状况 | 第8-9页 |
1.2.1 组合型切分歧义字段之与词次(word token) | 第8页 |
1.2.2 组合型切分歧义字段之与词形(word type) | 第8-9页 |
1.3 文献综述 | 第9-11页 |
1.3.1 组合型歧义的分类 | 第9-10页 |
1.3.2 组合型歧义的处理策略 | 第10-11页 |
1.4 本文的组织 | 第11-12页 |
第二章 本文研究策略的提出 | 第12-17页 |
2.1 组合型切分歧义字段的获取 | 第12-13页 |
2.2 歧义字段的分类 | 第13-15页 |
2.3 处理策略的提出 | 第15-17页 |
第三章 算法描述 | 第17-24页 |
3.1 获取训练集 | 第17-18页 |
3.2 统计搭配信息的分布情况 | 第18页 |
3.3 获取决策表 | 第18-22页 |
3.4 应用决策表 | 第22-24页 |
第四章 实验报告与分析 | 第24-35页 |
4.1 所用语料 | 第24页 |
4.2 选取实验用字段 | 第24-25页 |
4.3 基本准确率 | 第25页 |
4.4 运用决策表消歧 | 第25-31页 |
4.4.1 窗口大小k的取值 | 第25-27页 |
4.4.2 决策表的调整 | 第27-29页 |
4.4.3 实验结果分析 | 第29-31页 |
4.5 运用人工规则消歧 | 第31-33页 |
4.6 研究难点分析 | 第33-35页 |
4.6.1 对合、分两种形式分布悬殊的组合型切分歧义字段的处理 | 第33页 |
4.6.2 如何获取和应用上下文中的语义和深层句法信息进行消歧 | 第33-35页 |
第五章 结束语 | 第35-37页 |
5.1 本文研究总结 | 第35-36页 |
5.2 后续工作展望 | 第36-37页 |
附录 | 第37-39页 |
附表1 利用远距离信息进行消歧的组合型歧义字段 | 第37-38页 |
附表2 实验用字段在训练语科和测试语料中的分布情况 | 第38-39页 |
参考文献 | 第39-41页 |
致谢 | 第41页 |