第一章 绪论 | 第1-11页 |
1.1 研究邮件分类的背景和意义 | 第7页 |
1.2 问题描述 | 第7-8页 |
1.3 邮件分类技术在国内外的发展 | 第8-9页 |
1.3.1 特征表示与特征提取 | 第8-9页 |
1.3.2 分类决策方法 | 第9页 |
1.4 本文主要的工作内容 | 第9页 |
1.5 本文组织 | 第9-11页 |
第二章 向量空间模型及相关技术 | 第11-18页 |
2.1 文本的表示 | 第11页 |
2.2 向量空间模型 | 第11-13页 |
2.3 项的选择 | 第13-14页 |
2.4 项的权重计算 | 第14-15页 |
2.5 特征项的抽取 | 第15-16页 |
2.6 VSM的总结 | 第16-18页 |
第三章 聚类学习算法 | 第18-33页 |
3.1 什么是聚类分析 | 第18-19页 |
3.2 聚类算法涉及的各类型数据及预处理 | 第19-20页 |
3.3 现存重要的代表性聚类算法的分析与研究 | 第20-32页 |
3.3.1 划分方法(Partitioning Method) | 第20-23页 |
3.3.2 层次方法(Hierarchical Method) | 第23-28页 |
3.3.3 基于密度的方法(Density-Based Method) | 第28-29页 |
3.3.4 基于网格的方法(Grid-Based Method) | 第29-30页 |
3.3.5 基于模型的方法(Model-Based Method) | 第30-32页 |
3.4 总结 | 第32-33页 |
第四章 基于文本聚类技术的邮件分类技术 | 第33-42页 |
4.1 现有的基于文本挖掘的邮件分类技术 | 第33页 |
4.2 结合邮件自身的特点邮件聚类技术 | 第33-41页 |
4.2.1 邮件与一般的文本的区别 | 第33-34页 |
4.2.2 基于文本聚类技术的邮件分类系统 | 第34-41页 |
4.3 总结 | 第41-42页 |
第五章 系统评测 | 第42-48页 |
5.1 评测的必要性 | 第42页 |
5.2 评测方法 | 第42-43页 |
5.3 评测系统构建 | 第43页 |
5.3.1 测试需要的数据准备 | 第43页 |
5.3.2 测试用程序准备 | 第43页 |
5.4 实验结果 | 第43-47页 |
5.5 实验总结 | 第47-48页 |
第六章 总结与展望 | 第48-49页 |
6.1 本文总结 | 第48页 |
6.2 展望 | 第48-49页 |
参考文献 | 第49-51页 |
致谢 | 第51页 |