基于粒度计算的文本分类技术研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-15页
·研究背景	第9页
·研究意义	第9-10页
·信息检索	第9-10页
·信息过滤	第10页
·数字图书馆	第10页
·基于机器学习的知识发现技术在文本分类中的应用	第10-11页
·文本分类技术流程	第11-12页
·研究现状	第12-14页
·本文研究内容	第14-15页
第二章文本分类技术[2-27]	第15-27页
·文本分类任务	第15页
·文本表示模型	第15-16页
·文本预处理	第16页
·特征选择和特征抽取	第16-20页
·文档频率（Document Frequency，DF）	第16-17页
·信息增益（Information Gain）	第17页
·期望交叉熵（Expected Cross Entropy，ECE）	第17页
·互信息（Mutual Information）	第17页
·CHI 统计量	第17-18页
·GSS 系数	第18页
·NGL 系数	第18-19页
·几率比（Odds Ratio）	第19-20页
·分类方法	第20-24页
·决策树（Decision Trees）	第20页
·KNN 算法（K-Nearest Neighbor）	第20-21页
·朴素贝叶斯（Na ve Bayes）分类	第21页
·人工神经网络（Artificial Neural Network, ANN）	第21-22页
·支持向量机（SVM）	第22-23页
·粗糙集	第23-24页
·分类性能评估	第24-27页
·查全率和查准率	第24-25页
·宏平均和微平均	第25-27页
第三章基于分布距离的特征聚类方法	第27-35页
·引言	第27页
·文本特征降维	第27-28页
·降维对分类的影响	第27页
·特征选择	第27-28页
·特征抽取	第28页
·基于分布距离的特征聚类	第28-30页
·特征聚类	第28页
·特征分布距离	第28-30页
·聚类步骤	第30页
·实验结果及分析	第30-33页
·结论	第33-35页
第四章粒度计算的粗糙集理论模型[34-47]	第35-43页
·粒度计算概述	第35-36页
·粗糙集基本理论	第36-39页
·信息表和不可分辨关系	第36-37页
·上下近似关系	第37页
·属性依赖	第37-38页
·属性约简	第38-39页
·决策规则及其测度	第39页
·规则匹配及规则冲突解决[24]	第39-40页
·约简算法	第40-43页
·基于可分辨矩阵的属性约简算法[28]	第41-42页
·基于属性重要性的属性约简算法	第42-43页
第五章基于粒度计算的文本分类方法研究[25-30]	第43-55页
·基于粒度计算的文本分类方法流程	第43页
·训练集粒化分解	第43-44页
·构造粒度决策表	第44页
·文本粒度属性约简	第44-48页
·构建协同矩阵	第44-45页
·最相似样本	第45-46页
·启发式搜索最相似样本	第46-48页
·规则不一致解决方法	第48页
·分类算法描述	第48-49页
·信息粒度规则获取	第48-49页
·信息粒度属性约简	第49页
·实验结果及分析	第49-54页
·训练	第49-53页
·测试	第53-54页
·本章小结	第54-55页
总结与展望	第55-56页
参考文献	第56-59页
致谢	第59-60页
个人简介	第60页