基于模糊—粗糙集的文本分类模型
摘要 | 第1-3页 |
Abstract | 第3-4页 |
目录 | 第4-6页 |
第一章 引言 | 第6-9页 |
1.1 研究背景 | 第6-7页 |
1.2 本文的工作和论文的组织 | 第7-9页 |
第二章 文本分类综述 | 第9-30页 |
2.1 文本分类的基本概念 | 第9-11页 |
2.1.1 文本分类的类型 | 第9-10页 |
2.1.2 自动文本分类的过程 | 第10页 |
2.1.3 文本分类的应用领域 | 第10-11页 |
2.2 文本项的权重计算方法 | 第11-12页 |
2.3 降维技术 | 第12-18页 |
2.3.1 特征选择 | 第13-16页 |
2.3.2 特征提取 | 第16-18页 |
2.4 文本分类经典算法 | 第18-30页 |
2.4.1 Rocchio's算法 | 第19-20页 |
2.4.2 朴素贝叶斯分类算法 | 第20-23页 |
2.4.3 k近邻分类算法 | 第23-24页 |
2.4.4 决策树算法 | 第24-26页 |
2.4.5 基于投票的算法 | 第26-27页 |
2.4.6 支持向量机 | 第27-30页 |
第三章 模糊集与粗糙集 | 第30-37页 |
3.1 粗糙集理论 | 第30-33页 |
3.1.1 知识的分类观点 | 第30-31页 |
3.1.2 新型的隶属关系 | 第31页 |
3.1.3 概念的边界观点 | 第31-32页 |
3.1.4 知识约简 | 第32页 |
3.1.5 粗糙集理论在分类上的应用 | 第32-33页 |
3.2 模糊集 | 第33-37页 |
3.2.1 模糊集合 | 第33-34页 |
3.2.2 分解定理 | 第34页 |
3.2.3 模糊关系 | 第34-35页 |
3.2.4 模糊集理论在分类上的应用 | 第35-37页 |
第四章 基于模糊粗糙集理论的文本分类模型 | 第37-42页 |
4.1 概述 | 第37页 |
4.2 模糊—粗糙集 | 第37-39页 |
4.3 邻域空间 | 第39页 |
4.4 不确定性的出现和处理 | 第39-41页 |
4.4.1 模糊不确定性 | 第39-40页 |
4.4.2 粗糙不确定性 | 第40-41页 |
4.5 分类算法 | 第41-42页 |
第五章 实验结果与分析 | 第42-55页 |
5.1 Reuters-21578语料说明 | 第42-44页 |
5.1.1 文件格式 | 第42页 |
5.1.2 文档内部标记 | 第42-43页 |
5.1.3 类型 | 第43-44页 |
5.2 预处理与特征选择 | 第44-46页 |
5.3 实验结果的评估指标和评估方法 | 第46-49页 |
5.3.1 评估指标 | 第46-48页 |
5.3.2 评估方法 | 第48-49页 |
5.4 实验的步骤以及参数的选择 | 第49页 |
5.5 实验 | 第49-55页 |
5.5.1 参照方法简介 | 第49-50页 |
5.5.2 实验分析 | 第50-55页 |
第六章 总结与展望 | 第55-57页 |
6.1 本文总结 | 第55页 |
6.2 将来的工作 | 第55-57页 |
参考文献 | 第57-60页 |
论文与工作 | 第60-61页 |
致谢 | 第61-62页 |
独创性声明 | 第62页 |
论文使用授权说明 | 第62页 |