基于机器学习的文本分类算法改进与实现

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第10-16页
1.1 课题研究背景和意义	第10-11页
1.2 国内和国外研究现状	第11-12页
1.3 研究目标和研究内容	第12-13页
1.4 本文的组织结构	第13-16页
第2章文本分类相关技术与理论	第16-26页
2.1 文本分类相关理论	第16-17页
2.2 文本预处理	第17-18页
2.3 特征选择	第18-20页
2.3.1 文档频率	第19页
2.3.2 信息增益	第19页
2.3.3 X~2统计量	第19-20页
2.4 特征加权	第20-21页
2.5 分类算法	第21-24页
2.5.1 支持向量机SVM	第21-22页
2.5.2 朴素贝叶斯算法	第22-23页
2.5.3 K-邻近算法	第23-24页
2.6 分类性能评估	第24-25页
2.6.1 查全率	第25页
2.6.2 查准率	第25页
2.6.3 F1值	第25页
2.7 本章小结	第25-26页
第3章基于互信息的特征提取算法改进	第26-34页
3.1 传统互信息算法	第26-27页
3.2 互信息算法的不足	第27-29页
3.3 基于互信息的特征提取算法改进	第29-33页
3.3.1 针对负相关、分散度的改进	第29-31页
3.3.2 针对频度、集中度的改进	第31-32页
3.3.3 基于互信息的改进型特征提取算法	第32-33页
3.4 本章小结	第33-34页
第4章基于实数编码遗传算法的特征加权改进	第34-40页
4.1 特征加权算法相关介绍	第34-36页
4.1.1 特征加权方法概念	第34-35页
4.1.2 特征加权算法步骤	第35-36页
4.2 基于实数编码遗传算法的特征加权	第36-38页
4.2.1 实数编码遗传算法	第36-37页
4.2.2 基于遗传算法的特征选择	第37-38页
4.3 本章小结	第38-40页
第5章基于关联规则的KNN分类算法改进	第40-48页
5.1 KNN基本原理	第40-43页
5.1.1 KNN分类算法	第40-43页
5.2 关联规则	第43-44页
5.3 基于关联规则的KNN改进算法	第44-46页
5.3.1 基本思路	第44-45页
5.3.2 算法描述	第45-46页
5.4 本章小结	第46-48页
第6章实验与分析	第48-60页
6.1 基于互信息的特征提取改进算法	第48-51页
6.1.1 实验方法	第48页
6.1.2 数据集处理	第48页
6.1.3 实验结果	第48-51页
6.2 基于实数编码遗传算法的特征加权实验	第51-54页
6.2.1 实验设计	第51页
6.2.2 实验结果	第51-54页
6.3 基于关联规则的KNN分类算法实验	第54-58页
6.3.1 实验设计	第54-55页
6.3.2 实验结果	第55-58页
6.4 本章小结	第58-60页
结论	第60-62页
参考文献	第62-66页
攻读硕士学位期间取得的研究成果	第66-68页
致谢	第68页