哈萨克语固定词组提取系统的设计与实现

摘要	第4-5页
Abstract	第5页
第一章绪论	第11-14页
1.1 研究目的及意义	第11页
1.2 国内外发展现状	第11-12页
1.3 系统应用前景	第12页
1.4 论文研究内容	第12页
1.5 论文组织结构	第12-14页
第二章基本概念及相关技术介绍	第14-22页
2.1 哈萨克语的计算机理解	第14页
2.1.1 哈萨克语语言特点	第14页
2.1.2 哈萨克语标注体系	第14页
2.1.3 哈萨克语语言句子	第14页
2.2 固定词组概念	第14-16页
2.2.1 哈萨克语固定词组的组成定义	第15页
2.2.2 哈萨克语固定词组组成结构	第15-16页
2.3 固定词组提取方法综述	第16-21页
2.3.1 基于规则的固定词组提取方法	第16页
2.3.2 基于HMM的固定词组提取方法	第16-17页
2.3.3 基于SVM的固定词组提取方法	第17-18页
2.3.4 基于CRF的固定词组提取方法	第18-19页
2.3.5 基于最大熵的固定词组提取方法	第19-21页
2.4 本章小结	第21-22页
第三章系统需求分析	第22-28页
3.1 系统建设要求	第22-24页
3.2 系统建设原则	第24-25页
3.3 系统功能性需求分析	第25-26页
3.4 系统非功能性需求分析	第26-27页
3.4.1 扩展性、可操作性	第26-27页
3.4.2 安全性、规范性	第27页
3.5 本章小结	第27-28页
第四章系统设计	第28-40页
4.1 系统总体设计	第28-30页
4.2 哈萨克语固定词组结构与语料	第30-31页
4.3 带标记的固定词组的提取	第31-32页
4.4 基于规则的哈萨克语固定词组提取	第32-34页
4.4.1 哈萨克语固定词组的定界规则	第32页
4.4.2 固定短语定界规则的确定	第32-33页
4.4.3 固定词组的提取算法	第33-34页
4.5 基于最大熵的哈萨克语固定词组提取	第34-37页
4.5.1 最大熵模型理论	第34页
4.5.2 最大熵模型简介	第34页
4.5.3 最大熵模型在哈萨克固定词组提取中的应用	第34-35页
4.5.4 特征选择	第35-37页
4.6 通用迭代算法(GIS)	第37-39页
4.7 本章小结	第39-40页
第五章系统实现	第40-78页
5.1 系统开发环境与运行环境	第40页
5.1.1 系统开发工具	第40页
5.1.2 系统开发及运行环境	第40页
5.2 系统主要模块实现	第40-77页
5.2.1 基于规则的哈萨克语固定词组提取系统	第40-69页
5.2.2 基于最大熵的哈萨克语固定词组提取系统	第69-77页
5.3 本章小结	第77-78页
第六章系统测试	第78-84页
6.1 测试方法和工具	第78-81页
6.2 测试结果	第81-83页
6.3 测试结论	第83页
6.4 本章小结	第83-84页
第七章总结与展望	第84-86页
7.1 总结	第84页
7.2 展望	第84-86页
参考文献	第86-89页
致谢	第89页