哈萨克语文本分类系统的设计与实现

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第11-17页
1.1 项目背景和意义	第11-13页
1.2 国内外研究现状	第13-14页
1.3 内容概述	第14-15页
1.4 本文的组织结构	第15-17页
第二章文本分类技术及相关的算法	第17-32页
2.1 哈萨克语文本分类系统的原理	第17页
2.2 文本预处理模块	第17-18页
2.2.1 文本分类数据的特点	第17-18页
2.2.2 停用词的处理	第18页
2.3 哈萨克语文本的向量空间模型	第18-21页
2.4 哈萨克语文本的特征选择算法	第21-24页
2.4.1 文本频率（ DF ）	第21-22页
2.4.2 信息增益（IG）	第22页
2.4.3 互信息（ MI ）	第22-23页
2.4.4 CHI统计（x~2）	第23-24页
2.5 特征权重计算	第24-25页
2.5.1 布尔特征权重计算（Boolean Weighting）	第24页
2.5.2 词频TF特征权重计算（Term Frequency）	第24-25页
2.5.3 反文档频率IDF特征权重计算（Inverse Document Frequency）	第25页
2.5.4 IDFTF - 特征权重计算（Term Frequency-Inverse DocumentFrequency）	第25页
2.6 分类算法	第25-30页
2.6.1 朴素贝叶斯法NB（NaiveBayes）	第26-27页
2.6.2 类向量中心法	第27页
2.6.3 K最近距离法（ KNN ）	第27-28页
2.6.4 支持向量机法（SVM）	第28-30页
2.7 分类方法的评估	第30-31页
2.8 小结	第31-32页
第三章哈萨克语文本分类中的相关问题和KNN算法中特征权重的改进	第32-38页
3.1 哈萨克语介绍	第32页
3.2 哈萨克文编码	第32-33页
3.3 哈萨克文词干提取	第33-34页
3.4 哈萨克语词典排序算法	第34-35页
3.5 KNN算法中的改进	第35-37页
3.5.1 特征权重的改进	第35-37页
3.5.2 特征向量空间的构造	第37页
3.5.3 测试文本分类	第37页
3.6 小结	第37-38页
第四章哈萨克语文本分类系统的需求分析	第38-42页
4.1 软件系统的总体规划	第38-39页
4.2 系统的业务需求	第39-40页
4.3 系统的功能需求	第40页
4.4 系统的非功能需求	第40-41页
4.5 小结	第41-42页
第五章哈萨克语文本分类系统的设计与实现	第42-55页
5.1 设计和实现阶段的软件工程方法	第42页
5.2 哈萨克语文本分类系统体系结构	第42-43页
5.3 文本预处理模块	第43-44页
5.4 词频统计模块	第44-46页
5.5 特征选择模块	第46-49页
5.6 特征权重模块	第49-50页
5.7 KNN分类算法模块	第50页
5.8 结果评估模块	第50-51页
5.9 NET技术和C	第51-52页
5.10 C	第52-53页
5.11小结	第53-55页
第六章哈萨克语文本分类系统的实验与分析	第55-66页
6.1 软件测试概述	第55页
6.2 哈萨克语文本类别	第55-56页
6.3 哈萨克语文本分类特征词提取	第56-57页
6.4 系统界面	第57-59页
6.5 实验结果与分析	第59-65页
6.6 小结	第65-66页
第七章总结与展望	第66-68页
7.1 总结	第66-67页
7.2 展望	第67-68页
致谢	第68-69页
参考文献	第69-72页
附录	第72-122页