摘要 | 第1-5页 |
Abstract | 第5-9页 |
第一章 引言 | 第9-13页 |
·研究背景和意义 | 第9-10页 |
·垃圾邮件的概念和产生来源 | 第9页 |
·垃圾邮件的现状 | 第9-10页 |
·垃圾邮件的危害 | 第10页 |
·垃圾邮件的解决 | 第10-11页 |
·论文研究的内容 | 第11-12页 |
·论文章节的安排 | 第12-13页 |
第二章 电子邮件工作原理 | 第13-20页 |
·邮件传输的体系结构 | 第13-14页 |
·电子邮件系统相关协议 | 第14-19页 |
·SMTP 协议 | 第14-15页 |
·POP3 协议 | 第15-16页 |
·IMAP 协议 | 第16-17页 |
·MIME 协议 | 第17-19页 |
·电子邮件预处理 | 第19-20页 |
·邮件信头关键词提取 | 第19页 |
·邮件信体的提取 | 第19-20页 |
第三章 垃圾邮件过滤技术概述 | 第20-36页 |
·文本分类概况 | 第20-21页 |
·特征选择方法 | 第21-23页 |
·基于规则的垃圾邮件过滤技术 | 第23-26页 |
·黑白名单技术 | 第23页 |
·反向域名验证 | 第23-24页 |
·发送者身份认证 | 第24-25页 |
·SMTP 通信链接速率、频度的设定 | 第25页 |
·挑战-响应技术 | 第25页 |
·病毒和脚本行为检查 | 第25页 |
·信头分析 | 第25-26页 |
·关键词精确匹配 | 第26页 |
·基于内容的垃圾邮件过滤技术 | 第26-32页 |
·贝叶斯分类算法 | 第27页 |
·KNN 算法 | 第27-28页 |
·决策树 | 第28-29页 |
·Boosting 方法 | 第29页 |
·支持向量机 | 第29-32页 |
·垃圾邮件过滤的常用语料库 | 第32-34页 |
·垃圾邮件分类器学习与测试 | 第34页 |
·垃圾邮件过滤的评价 | 第34-36页 |
第四章 偏最小二乘回归的线性方法 | 第36-44页 |
·基于线性 PLS 的垃圾邮件过滤模型 | 第37-38页 |
·偏最小二乘回归的基本思想 | 第38-44页 |
·计算方法推导 | 第38-40页 |
·两点性质 | 第40-41页 |
·成分数的确定 | 第41-44页 |
第五章 基于核方法的偏最小二乘分类垃圾邮件过滤模型 | 第44-50页 |
·核方法 | 第44-48页 |
·核函数 | 第44-47页 |
·可再生核希尔伯特空间 | 第47-48页 |
·基于核方法的偏最小二乘垃圾邮件过滤模型 | 第48-50页 |
第六章 实验 | 第50-55页 |
·实验数据集 | 第50页 |
·语料库的预处理 | 第50-51页 |
·实验设计与结果分析 | 第51-55页 |
第七章 总结和将来的工作 | 第55-56页 |
参考文献 | 第56-60页 |
个人情况 | 第60-61页 |
致谢 | 第61页 |