基于粗糙集的文本分类方法研究
第一章 引言 | 第1-18页 |
·问题的描述 | 第13页 |
·文本分类的研究背景和意义 | 第13-14页 |
·国内外相关研究概述 | 第14-16页 |
·国外自动分类研究动态 | 第14-15页 |
·国内研究情况 | 第15-16页 |
·本文的组织结构 | 第16-18页 |
第二章 粗糙集理论简介 | 第18-24页 |
·概述 | 第18页 |
·分类与知识库 | 第18-19页 |
·信息表知识表达系统与决策表 | 第19-20页 |
·信息表知识表达系统 | 第19页 |
·决策表 | 第19-20页 |
·知识约简 | 第20-22页 |
·决策表的属性约简 | 第20-21页 |
·粗糙集的值约简 | 第21-22页 |
·基于可区分矩阵的属性约简算法 | 第22-23页 |
·属性约简与核的计算 | 第22页 |
·相对约简与相对核的计算 | 第22-23页 |
·将粗糙集理论运用于文本分类的可行性分析 | 第23-24页 |
第三章 特征抽取 | 第24-31页 |
·文本预处理 | 第24-26页 |
·文本的表示形式 | 第24页 |
·特征项的选择 | 第24-25页 |
·分词词库的扩充 | 第25页 |
·停用词的过滤 | 第25页 |
·记录词语在文档中的位置 | 第25-26页 |
·常用的特征抽取方法 | 第26-27页 |
·基于成对比较法的特征选择 | 第27-31页 |
·成对比较法的提出 | 第27页 |
·将成对比较法用于特征抽取的可行性分析 | 第27-28页 |
·成对比较法的基本步骤 | 第28页 |
·根据影响程度为词语打分 | 第28页 |
·构造判断矩阵 | 第28-30页 |
·计算矩阵的主特征值和主特征向量 | 第30-31页 |
第四章 权重计算 | 第31-36页 |
·己有的权重函数 | 第31-32页 |
·权重函数的改进 | 第32-33页 |
·权重的离散化 | 第33-36页 |
·常用的离散化方法 | 第33-34页 |
·离散化参数的选择及结果 | 第34-36页 |
第五章 类别的判定 | 第36-42页 |
·常用的分类算法 | 第36-39页 |
·基于粗糙集理论的文本分类 | 第39-42页 |
·用决策表表达分类知识 | 第39页 |
·知识约简 | 第39-40页 |
·相对约简计算 | 第40页 |
·规则的合成策略 | 第40-41页 |
·匹配算法 | 第41-42页 |
第六章 试验结果分析 | 第42-45页 |
·评估方法 | 第42页 |
·试验数据 | 第42-43页 |
·结果分析 | 第43-45页 |
第七章 结论 | 第45-46页 |
参考文献 | 第46-49页 |
致谢 | 第49-50页 |
附录 | 第50-51页 |