融合多策略的维吾尔语词干提取方法
摘要 | 第2-3页 |
Abstract | 第3页 |
第一章 引言 | 第6-14页 |
1.1 课题研究背景及意义 | 第6-9页 |
1.1.1 研究背景 | 第6-7页 |
1.1.2 研究意义 | 第7-9页 |
1.2 国内外研究进展 | 第9-12页 |
1.2.1 国外词干提取研究状况 | 第9-11页 |
1.2.2 国内词干提取研究状况 | 第11-12页 |
1.3 主要工作和组织结构 | 第12-14页 |
第二章 维吾尔语词法规则 | 第14-22页 |
2.1 维吾尔语词法特征 | 第14-17页 |
2.1.1 维吾尔语弱化特性 | 第15-16页 |
2.1.2 维吾尔语和谐规律 | 第16页 |
2.1.3 元音脱落和辅音增音 | 第16-17页 |
2.2 维吾尔语词类 | 第17页 |
2.2.1 维吾尔语词性分类 | 第17页 |
2.3 上下文信息概述 | 第17-18页 |
2.4 维吾尔语词干切分分析 | 第18-19页 |
2.5 维吾尔语音节切分分析 | 第19-20页 |
2.6 词干提取语料库介绍 | 第20-22页 |
第三章 词干提取模型 | 第22-27页 |
3.1 基于规则的词干提取方法 | 第22页 |
3.2 基于统计的词干提取方法 | 第22-25页 |
3.2.1 N-Gram的语言模型 | 第23页 |
3.2.2 隐马尔可夫模型 | 第23-24页 |
3.2.3 后续变化模型 | 第24-25页 |
3.3 基于混合词干提取方法 | 第25页 |
3.4 常用平滑算法 | 第25-27页 |
第四章 融合多策略的维吾尔语词干提取方法 | 第27-38页 |
4.1 规则库的建立 | 第27-28页 |
4.2 统计语言模型的建立 | 第28-30页 |
4.3 基准系统存在的问题及解决方案 | 第30-31页 |
4.4 维吾尔语词性特征 | 第31-33页 |
4.5 上下文词干信息 | 第33-35页 |
4.6 实验结果及分析 | 第35-38页 |
4.6.1 实验设置 | 第35页 |
4.6.2 实验结果及分析 | 第35-38页 |
第五章 基于词干词缀统计量的维吾尔语词干提取方法 | 第38-44页 |
5.1 基于词干词缀统计量的维吾尔语词干提取过程 | 第39-41页 |
5.2 实验结果及分析 | 第41-44页 |
5.2.1 实验设置 | 第41页 |
5.2.2 实验结果与分析 | 第41-44页 |
第六章 总结与展望 | 第44-45页 |
参考文献 | 第45-48页 |
攻读硕士期间发表论文和参加科研情况 | 第48-49页 |
致谢 | 第49-50页 |