基于偏最小二乘方法的垃圾邮件过滤研究
中文摘要 | 第1-4页 |
英文摘要 | 第4-8页 |
1 引言 | 第8-17页 |
·研究背景 | 第8-9页 |
·垃圾邮件定义 | 第8页 |
·垃圾邮件发展现状及其危害 | 第8-9页 |
·反垃圾邮件技术现状 | 第9-10页 |
·反垃圾邮件立法 | 第9-10页 |
·垃圾邮件过滤技术 | 第10页 |
·垃圾邮件过滤技术介绍 | 第10-14页 |
·服务器端和客户端的邮件过滤 | 第10-12页 |
·白名单和黑名单 | 第12页 |
·设置过滤规则 | 第12-13页 |
·基于内容的垃圾邮件过滤技术 | 第13-14页 |
·本文研究的内容 | 第14-16页 |
·论文组织 | 第16-17页 |
2 基于内容的垃圾邮件过滤技术概述 | 第17-36页 |
·邮件的表示 | 第17-18页 |
·项的权值 | 第18页 |
·维数约减 | 第18-31页 |
·特征选择 | 第19-23页 |
·特征抽取 | 第23-31页 |
·邮件过滤算法 | 第31-34页 |
·最小距离分类器(Ricchio) | 第32页 |
·K 近邻分类器 | 第32-33页 |
·SVM 分类器 | 第33-34页 |
·决策树算法 | 第34页 |
·评价方法 | 第34-36页 |
3 偏最小二乘特征抽取 | 第36-48页 |
·偏最小二乘概述 | 第36-39页 |
·偏最小二乘的产生背景与发展 | 第36页 |
·多重相关性问题 | 第36-37页 |
·偏最小二乘的基本思想及特点 | 第37-38页 |
·偏最小二乘的工作目标 | 第38-39页 |
·单变量的偏最小二乘回归 | 第39-45页 |
·算法推导 | 第40-42页 |
·交叉有效性 | 第42-45页 |
·偏最小二乘特征抽取 | 第45-48页 |
·基本原理 | 第45-46页 |
·数学公式推导 | 第46-47页 |
·偏最小二乘特征抽取方法 | 第47-48页 |
4 实验与分析 | 第48-55页 |
·实验数据集及预处理 | 第48-49页 |
·数据集分析 | 第49页 |
·实验设计 | 第49-53页 |
·实验分析与讨论 | 第53-55页 |
5 结论和今后的工作 | 第55-57页 |
参考文献 | 第57-61页 |
在学期间公开发表论文及著作情况 | 第61-62页 |
致谢 | 第62页 |