| 摘要 | 第1-6页 |
| Abstract | 第6-10页 |
| 第1章 绪论 | 第10-15页 |
| ·课题来源 | 第10页 |
| ·课题背景及研究意义 | 第10-11页 |
| ·垃圾邮件过滤技术研究现状 | 第11-14页 |
| ·本文主要内容及章节安排 | 第14-15页 |
| 第2章 电子邮件原理及文本分类技术 | 第15-26页 |
| ·邮件的传输过程 | 第15-16页 |
| ·常见的电子邮件协议 | 第16-17页 |
| ·电子邮件的报文格式 | 第17-19页 |
| ·电子邮件的解析过程 | 第19-20页 |
| ·文本分类 | 第20-25页 |
| ·文本表示 | 第20-22页 |
| ·中文分词 | 第22-23页 |
| ·文本特征项提取 | 第23-25页 |
| ·本章小结 | 第25-26页 |
| 第3章 基于支持向量机的垃圾邮件过滤技术 | 第26-36页 |
| ·支持向量机理论 | 第26-31页 |
| ·理论背景 | 第26-27页 |
| ·支持向量机的思想和原理 | 第27-29页 |
| ·常见的核函数 | 第29-30页 |
| ·核函数作用及核参数的影响 | 第30页 |
| ·支持向量机方法的优点 | 第30-31页 |
| ·改进的SVM 算法 | 第31-33页 |
| ·基于SVM 算法的常见实现 | 第31-32页 |
| ·LIBSVM | 第32-33页 |
| ·将SVM 理论用于垃圾邮件处理 | 第33-34页 |
| ·SVM 模型建立 | 第34-35页 |
| ·本章小结 | 第35-36页 |
| 第4章 垃圾邮件过滤系统的预处理 | 第36-50页 |
| ·垃圾邮件的新形式 | 第36-37页 |
| ·针对HTML 格式垃圾邮件的处理 | 第37-42页 |
| ·基于HTML 结构特征的正文信息提取 | 第37-41页 |
| ·基于URL 黑名单的链接类垃圾邮件过滤 | 第41-42页 |
| ·中文分词 | 第42-46页 |
| ·建立停用词表 | 第42-43页 |
| ·建立基于词性和专业性的中英文分词词典 | 第43-44页 |
| ·运用开源软件包Lucene 和GATE 进行分词 | 第44页 |
| ·分词实现过程 | 第44-46页 |
| ·基于相似度曲线的特征提取 | 第46-49页 |
| ·本章小结 | 第49-50页 |
| 第5章 基于SVM 的垃圾邮件过滤模型实现 | 第50-60页 |
| ·SVM 训练 | 第50-53页 |
| ·邮件样本集的选取 | 第50页 |
| ·训练调参 | 第50-51页 |
| ·训练步骤 | 第51-53页 |
| ·分类过程的设计与实现 | 第53-55页 |
| ·仿真实验 | 第55-59页 |
| ·软硬件环境 | 第55页 |
| ·垃圾邮件过滤系统的评价体系 | 第55-56页 |
| ·实验结果及分析 | 第56-59页 |
| ·本章小结 | 第59-60页 |
| 结论 | 第60-61页 |
| 附录 | 第61-64页 |
| 参考文献 | 第64-68页 |
| 攻读硕士学位期间发表的学术论文 | 第68-69页 |
| 致谢 | 第69页 |