基于粗糙集的文本分类技术研究

摘要	第1-5页
Abstract	第5-9页
第1章绪论	第9-13页
·论文研究的背景及意义	第9-11页
·论文主要工作介绍	第11-12页
·论文的结构和安排	第12-13页
第2章文本分类概述	第13-26页
·文本分词(Text Segmentation)	第13-16页
·特征选择(Feature Selection,FS)	第15-16页
·文本描述(Text Respresentation)	第16-19页
·布尔模型(Boolean Model)	第16-17页
·空间向量模型(Vector Space Model)	第17-18页
·概率模型(Probabilistic Model)	第18-19页
·分类算法(Classification Algorithm)	第19-26页
·朴素贝叶斯算法(Naive Bayes)	第20页
·KNN(k-Nearest Neighbor)算法	第20-21页
·基于神经网络的算法(Artificial Neural Networks)	第21-23页
·决策树方法(Decision Tree)	第23-24页
·粗糙集方法(Rough Set)	第24-26页
第3章基于特征选择的权值计算研究	第26-34页
·常见特征选择方法	第26-29页
·信息增益(Information Gain)	第26-27页
·互信息(Mutual Information)	第27页
·CHI2统计	第27-28页
·交叉熵(Cross Entropy)	第28页
·证据权值(Weight of Evidence)	第28-29页
·经典权值计算公式TFIDF及其弊端	第29-30页
·基于特征选择的TFIDF权值计算改进研究	第30-31页
·实验设计和结果	第31-34页
第4章基于粗集理论的文本分类概述	第34-44页
·粗集基本概念	第34-39页
·信息系统	第34-35页
·决策表信息系统	第35-36页
·等价关系	第36页
·不可分辨关系	第36页
·近似空间	第36-38页
·知识约简	第38-39页
·基于粗糙集理论的文本分类系统	第39-44页
·文本向量描述	第41页
·权值离散化	第41-42页
·构造决策信息表	第42页
·进行决策信息表条件属性约简	第42-43页
·对分类规则进行值约简	第43页
·生成分类规则	第43页
·对新文本进行分类	第43-44页
第5章粗糙集启发式属性约简的改进	第44-58页
·属性重要性评价研究	第44-47页
·粗糙集理论对属性重要性的代数形式衡量方法	第44-46页
·基于文本特征选择的属性重要性的衡量方法	第46页
·综合糙集理论和文本特征选择的属性重要性评价	第46-47页
·启发式属性约简的研究和改进	第47-49页
·基于空集基础上的属性约简算法	第47-48页
·基于约简核基础上的属性约简算法	第48页
·改进启发式属性约简算法	第48-49页
·基于改进启发式属性约简的粗糙集文本分类系统	第49-51页
·实验结果和分析	第51-58页
·属性重要性的实验比较研究	第51-56页
·改进启发式属性约简的实验比较研究	第56-58页
总结与展望	第58-60页
全文总结	第58-59页
进一步研究工作展望	第59-60页
致谢	第60-61页
参考文献	第61-66页
攻读硕士学位期间发表的论文	第66页