基于粗糙集的文本分类算法研究

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-14页
·引言	第10页
·文本分类的研究背景和意义	第10-11页
·国内外相关研究	第11-13页
·国外自动分类研究动态	第11-12页
·国内研究情况	第12-13页
·论文框架	第13-14页
第二章粗糙集理论、WEB 挖掘和文本分类	第14-24页
·引言	第14页
·粗糙集基本概念	第14-17页
·粗糙集定义	第14页
·知识与不分明关系	第14-15页
·粗糙集与近似	第15-16页
·近似精度	第16-17页
·数据集的约简	第17-20页
·决策表	第17-18页
·约简与核	第18-19页
·可辨识矩阵	第19-20页
·规则集	第20页
·WEB 挖掘及其分类	第20-21页
·Web 挖掘	第20-21页
·Web 挖掘的分类	第21页
·文本分类算法	第21-24页
·简单中心向量比较算法	第21-22页
·支持向量机方法	第22-23页
·k 近邻法	第23-24页
第三章文本特征提取	第24-35页
·文本的预处理	第24-31页
·文本的表示	第24-27页
·特征项的选择	第27-28页
·停用词的过滤	第28页
·中文分词面临的问题	第28-29页
·中文分词方法	第29-30页
·设置位置系数	第30-31页
·文本特征选择方法	第31-35页
·互信息	第31页
·χ~2 统计量	第31-32页
·文档频率	第32页
·信息增益	第32-33页
·期望交叉熵	第33-35页
第四章权重计算	第35-39页
·常用的权重函数	第35-36页
·布尔权重函数	第35页
·TF-IDF	第35-36页
·ITC	第36页
·ENTROPY	第36页
·Okapi	第36页
·OKAPI 函数的改进	第36-37页
·权重的离散化	第37-39页
·等距离划分算法	第37页
·等频率划分算法	第37-38页
·Chi-merge 离散化方法	第38-39页
第五章基于粗糙集理论的分类算法研究	第39-44页
·基于粗糙集的文本分类方法的流程	第39-40页
·关键技术	第40-41页
·预处理	第40页
·特征项提取	第40页
·特征项权值的离散化	第40-41页
·决策表的构造	第41页
·决策规则的表示	第41页
·文本分类实验	第41-44页
·试验评估方法	第41-42页
·试验数据及实验结果	第42-44页
结束语	第44-45页
参考文献	第45-47页
致谢	第47页