基于粗糙集的Web文本分类技术研究

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-16页
·WEB 文本分类的研究背景和意义	第10-11页
·WEB 文本分类的研究现状及前景	第11-13页
·粗糙集理论的研究现状	第13-14页
·论文组织结构	第14-16页
第二章 WEB 文本分类概述	第16-31页
·文本分类的基本概念	第16页
·WEB 文本分类系统的流程设计	第16-18页
·WEB 文本预处理	第18-19页
·特征提取方法	第19-23页
·文档频率	第19-20页
·信息增益	第20页
·互信息	第20-21页
·期望交叉熵	第21-22页
·χ2 统计量	第22-23页
·特征项的权重计算	第23页
·常用文本分类算法	第23-30页
·支持向量机	第24-25页
·K-近邻	第25-27页
·决策树	第27-29页
·朴素贝叶斯	第29-30页
·本章小结	第30-31页
第三章粗糙集理论	第31-46页
·粗糙集的基本概念	第31-34页
·知识与分类	第31-32页
·不可分辨关系	第32页
·两个知识库的关系	第32页
·集合的下近似和上近似	第32-33页
·粗糙集和精确集	第33-34页
·集合的近似精度和粗糙度	第34页
·粗糙集理论中的知识表示	第34-35页
·知识约简	第35-40页
·知识的约简与核	第36页
·知识的相对约简和相对核	第36-38页
·决策表中知识约简的一般步骤	第38-40页
·常用的知识约简算法	第40-45页
·盲目删除属性约简	第40-42页
·基于属性重要度的约简	第42-43页
·基于区分矩阵的约简	第43-45页
·本章小结	第45-46页
第四章 WEB 文本特征项权重计算及改进	第46-52页
·特征项权重计算方法	第46-48页
·布尔函数	第46-47页
·TF-IDF 函数	第47页
·Okapi 函数	第47-48页
·TF-IDF 权重计算方法的不足与改进	第48-50页
·TF-IDF 算法的不足	第48-49页
·TF-IDF 算法的改进	第49-50页
·权重离散化	第50-51页
·本章小结	第51-52页
第五章基于粗糙集理论的WEB 文本分类	第52-66页
·基于粗糙集的WEB 文本分类方法的处理流程	第52-53页
·WEB 文本分类器的构造流程	第52-53页
·WEB 文本分类器的测试流程	第53页
·WEB 文本的预处理	第53-57页
·网页噪声的去除	第54-55页
·中文分词	第55-56页
·去停用词	第56-57页
·特征项的提取	第57页
·特征项权重的计算	第57-58页
·特征项权重的离散化	第58页
·决策表的构造及约简	第58-60页
·决策规则的表示	第60-61页
·WEB 文本分类测试与结果分析	第61-65页
·分类数据的评价指标	第61-62页
·实验数据及步骤	第62-65页
·本章小结	第65-66页
第六章结论与展望	第66-68页
·研究总结	第66-67页
·后续工作	第67-68页
参考文献	第68-72页
致谢	第72-73页