基于偏最小二乘方法的垃圾邮件过滤研究
| 中文摘要 | 第1-4页 |
| 英文摘要 | 第4-8页 |
| 1 引言 | 第8-17页 |
| ·研究背景 | 第8-9页 |
| ·垃圾邮件定义 | 第8页 |
| ·垃圾邮件发展现状及其危害 | 第8-9页 |
| ·反垃圾邮件技术现状 | 第9-10页 |
| ·反垃圾邮件立法 | 第9-10页 |
| ·垃圾邮件过滤技术 | 第10页 |
| ·垃圾邮件过滤技术介绍 | 第10-14页 |
| ·服务器端和客户端的邮件过滤 | 第10-12页 |
| ·白名单和黑名单 | 第12页 |
| ·设置过滤规则 | 第12-13页 |
| ·基于内容的垃圾邮件过滤技术 | 第13-14页 |
| ·本文研究的内容 | 第14-16页 |
| ·论文组织 | 第16-17页 |
| 2 基于内容的垃圾邮件过滤技术概述 | 第17-36页 |
| ·邮件的表示 | 第17-18页 |
| ·项的权值 | 第18页 |
| ·维数约减 | 第18-31页 |
| ·特征选择 | 第19-23页 |
| ·特征抽取 | 第23-31页 |
| ·邮件过滤算法 | 第31-34页 |
| ·最小距离分类器(Ricchio) | 第32页 |
| ·K 近邻分类器 | 第32-33页 |
| ·SVM 分类器 | 第33-34页 |
| ·决策树算法 | 第34页 |
| ·评价方法 | 第34-36页 |
| 3 偏最小二乘特征抽取 | 第36-48页 |
| ·偏最小二乘概述 | 第36-39页 |
| ·偏最小二乘的产生背景与发展 | 第36页 |
| ·多重相关性问题 | 第36-37页 |
| ·偏最小二乘的基本思想及特点 | 第37-38页 |
| ·偏最小二乘的工作目标 | 第38-39页 |
| ·单变量的偏最小二乘回归 | 第39-45页 |
| ·算法推导 | 第40-42页 |
| ·交叉有效性 | 第42-45页 |
| ·偏最小二乘特征抽取 | 第45-48页 |
| ·基本原理 | 第45-46页 |
| ·数学公式推导 | 第46-47页 |
| ·偏最小二乘特征抽取方法 | 第47-48页 |
| 4 实验与分析 | 第48-55页 |
| ·实验数据集及预处理 | 第48-49页 |
| ·数据集分析 | 第49页 |
| ·实验设计 | 第49-53页 |
| ·实验分析与讨论 | 第53-55页 |
| 5 结论和今后的工作 | 第55-57页 |
| 参考文献 | 第57-61页 |
| 在学期间公开发表论文及著作情况 | 第61-62页 |
| 致谢 | 第62页 |