文本分类中基于k-means的特征选择算法研究

摘要	第5-7页
ABSTRACT	第7-8页
缩略语对照表	第11-14页
第一章绪论	第14-20页
1.1 研究背景和研究意义	第14页
1.2 国内外研究现状	第14-15页
1.3 应用前景	第15-17页
1.4 论文研究内容及安排	第17-20页
第二章文本分类	第20-36页
2.1 自动文本分类步骤	第20-21页
2.2 分词及去停用词	第21-27页
2.2.1 常用语料库	第21-24页
2.2.2 分词技术	第24-26页
2.2.3 停用词技术	第26-27页
2.3 特征加权	第27-28页
2.4 文本表示	第28-29页
2.5 分类算法	第29-34页
2.6 本章小结	第34-36页
第三章特征选择算法	第36-42页
3.1 引言	第36页
3.2 特征选择概述	第36-38页
3.3 常用的几种特征选择算法	第38-41页
3.3.1 文档频率（DF）	第38页
3.3.2 信息增益（IG）	第38-39页
3.3.3 互信息(MI)	第39-40页
3.3.4 期望交叉熵（ECE）	第40页
3.3.5 卡方统计（CHI）	第40-41页
3.4 本章小结	第41-42页
第四章聚类特征选择算法的实现	第42-58页
4.1 k-means聚类算法	第42-45页
4.2 基于k-means的特征选择算法	第45-47页
4.3 实验平台实现	第47-49页
4.4 结果分析	第49-56页
4.4.1 实验设置	第49-52页
4.4.2 结果分析	第52-56页
4.5 本章小结	第56-58页
第五章实验与分析	第58-64页
5.1 实验设置	第58-59页
5.1.1 实验方法	第58页
5.1.2 数据准备	第58-59页
5.2 性能对比分析	第59-62页
5.3 本章小结	第62-64页
第六章总结和展望	第64-66页
6.1 论文总结	第64页
6.2 研究展望	第64-66页
参考文献	第66-70页
致谢	第70-72页
作者简介	第72-73页
1. 基本情况	第72页
2. 教育背景	第72-73页