基于N-gram的维吾尔文文本分类研究与系统实现

摘要	第3-4页
Abstract	第4-5页
目录	第6-8页
第一章序言	第8-13页
1.1 研究背景和意义	第8-9页
1.2 国内外研究状况	第9-11页
1.2.1 文本分类在国外的发展状况	第9-10页
1.2.2 文本分类在国内的发展	第10-11页
1.3 本文的主要研究内容	第11页
1.4 论文结构	第11-13页
第二章文本分类的相关技术	第13-29页
2.1 文本分类的概述	第13-14页
2.2 文本表示	第14-18页
2.2.1 文本表示单元	第14-15页
2.2.2 文本表示模型	第15-18页
2.3 预处理	第18-21页
2.3.1 分词	第19页
2.3.2 非法字符处理	第19页
2.3.3 词干提取	第19-20页
2.3.4 去除停用词	第20-21页
2.4 特征选择	第21-23页
2.4.1 文档频率	第21页
2.4.2 互信息	第21-22页
2.4.3 X2统计量	第22页
2.4.4 信息增益	第22-23页
2.4.5 期望交叉熵	第23页
2.5 特征权重	第23-25页
2.6 分类算法	第25-27页
2.6.1 朴素贝叶斯算法	第25页
2.6.2 支持向量机算法	第25-26页
2.6.3 K 近邻分类算法	第26-27页
2.7 文本分类的评估指标	第27-28页
2.8 本章总结	第28-29页
第三章基于 N-gram 的维吾尔文文本模型	第29-38页
3.1 维吾尔文特点	第29-31页
3.2 N-gram 模型	第31-33页
3.3 N-gram 的优点	第33页
3.4 N-gram 模型关键问题	第33-35页
3.4.1 参数 N 的选择	第33-34页
3.4.2 N-gram 特征的提取过程	第34-35页
3.5 基于 N-gram 频率统计文本分类	第35-37页
3.6 本章小结	第37-38页
第四章基于 N-gram 的维吾尔文文本分类实验及结果分析	第38-51页
4.1 语料库	第38-39页
4.2 实验环境	第39页
4.3 系统特点	第39-40页
4.4 构建每类的 N-gram 特征库模块	第40-41页
4.5 测试模块	第41-44页
4.6 分类性能评价模块	第44页
4.7 实验结果分析	第44-51页
第五章总结与展望	第51-52页
5.1 总结	第51页
5.2 展望	第51-52页
参考文献	第52-54页
攻读硕士期间发表论文和参加科研情况	第54-55页
致谢	第55页