摘要 | 第3-4页 |
Abstract | 第4-5页 |
第一章 绪论 | 第8-13页 |
1.1 课题来源 | 第8页 |
1.2 自然语言理解概述 | 第8-9页 |
1.3 词性标注的意义和难点 | 第9-10页 |
1.4 词性标注和兼类词的研究现状 | 第10-11页 |
1.5 本文研究内容及架构 | 第11-13页 |
第二章 基于统计模型的哈语兼类词词性标注 | 第13-30页 |
2.1 哈萨克语词性标识集 | 第13-14页 |
2.2 特征模板的自动选择 | 第14-15页 |
2.3 基于最大熵的哈语兼类词词性标注 | 第15-23页 |
2.3.1 最大熵模型概述 | 第15-16页 |
2.3.2 特征选取 | 第16-19页 |
2.3.3 最大熵模型解码及优化方法 | 第19-21页 |
2.3.4 最大熵模型在哈语兼类词词性标注中的应用 | 第21-23页 |
2.4 基于条件随机场的哈语兼类词词性标注 | 第23-28页 |
2.4.1 条件随机场概述 | 第23-25页 |
2.4.2 特征选取及参数估计 | 第25-27页 |
2.4.3 数据预处理 | 第27页 |
2.4.4 条件随机场模型在哈语兼类词词性标注中的应用 | 第27-28页 |
2.5 最大熵与条件随机场模型的比较 | 第28-30页 |
第三章 基于关联规则的哈语词性标注规则提取 | 第30-36页 |
3.1 关联规则简介 | 第30-31页 |
3.2 词性标注规则的挖掘算法与应用 | 第31-32页 |
3.3 规则库的建立及测试 | 第32-36页 |
第四章 系统架构及实验 | 第36-50页 |
4.1 系统设计及实现 | 第36-45页 |
4.1.1 基于最大熵模型的哈语兼类词词性标注系统的设计与实现 | 第37-39页 |
4.1.2 基于CRF的哈语兼类词词性标注系统的设计与实现 | 第39-42页 |
4.1.3 基于关联规则的哈语词性标注系统的设计与实现 | 第42-45页 |
4.2 实验 | 第45-50页 |
4.2.1 实验数据 | 第45-46页 |
4.2.2 实验结果及分析 | 第46-50页 |
第五章 总结与展望 | 第50-51页 |
5.1 总结 | 第50页 |
5.2 展望 | 第50-51页 |
参考文献 | 第51-55页 |
攻读硕士学位期间发表的论文 | 第55-56页 |
致谢 | 第56页 |