基于关联技术的中文文本分类研究
摘要 | 第1-4页 |
Abstract | 第4-7页 |
1 绪论 | 第7-11页 |
·课题研究背景及意义 | 第7-8页 |
·国内外研究现状 | 第8-9页 |
·文本挖掘概述 | 第9-10页 |
·文本挖掘的定义 | 第9页 |
·文本挖掘的过程 | 第9-10页 |
·本文主要工作 | 第10-11页 |
2 中文文本关联分类概述 | 第11-28页 |
·中文文本分类的简介 | 第11-12页 |
·中文文本分类 | 第11-12页 |
·中文文本分类的难点 | 第12页 |
·中文文本常见分类方法 | 第12-15页 |
·基于关联的文本分类方法 | 第15-28页 |
·基于关联规则的分析 | 第15-20页 |
·关联文本分类的分析 | 第20-28页 |
3 文本分类算法的性能比较研究 | 第28-38页 |
·问题的引入 | 第28页 |
·中文文本数据集的选定与使用 | 第28-30页 |
·中文文本的表示 | 第30-32页 |
·文本分类器的性能评价标准 | 第32-34页 |
·中文文本特征表示与分类器性能对比 | 第34-38页 |
·实验的设计 | 第34-35页 |
·实验结果与分析 | 第35-38页 |
4 基于最优频繁闭项集的中文文本分类的研究 | 第38-50页 |
·方法的引入 | 第38页 |
·基本说明 | 第38-39页 |
·频繁闭项集的再探 | 第38-39页 |
·最优频繁闭项集的提出 | 第39页 |
·最优K-频繁闭项集的挖掘 | 第39-44页 |
·理论准备 | 第39-42页 |
·有效的挖掘策略 | 第42-44页 |
·基于CMAR改进的中文文本分类 | 第44-46页 |
·改进的主要思路 | 第44页 |
·最优类关联闭规则的挖掘 | 第44-46页 |
·基于最优类关联闭规则的中文文本分类 | 第46页 |
·实验与结果分析 | 第46-50页 |
·实验的准备 | 第46页 |
·实验的结果分析 | 第46-50页 |
5 基于潜在关联规则的中文文本分类的研究 | 第50-65页 |
·方法的引入 | 第50页 |
·基于规则的分类 | 第50-52页 |
·基于潜在关联规则的中文文本分类 | 第52-60页 |
·问题引人 | 第52-53页 |
·基于CPAR的改进算法 | 第53-60页 |
·实验与结果分析 | 第60-65页 |
·实验的准备 | 第60-61页 |
·实验的结果分析 | 第61-65页 |
6 总结与展望 | 第65-66页 |
·本文总结 | 第65页 |
·未来展望 | 第65-66页 |
致谢 | 第66-67页 |
参考文献 | 第67-69页 |