基于内容的电子邮件过滤系统的研究与设计
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 引言 | 第9-16页 |
·什么是垃圾邮件 | 第9-10页 |
·垃圾邮件过滤的研究意义 | 第10-11页 |
·反垃圾邮件技术的研究现状 | 第11-15页 |
·根源阻断 | 第11页 |
·存在发现 | 第11-15页 |
·论文结构 | 第15-16页 |
第二章 电子邮件相关知识 | 第16-27页 |
·电子邮件的组成及工作原理 | 第16-19页 |
·邮件用户代理(MUA) | 第16-17页 |
·邮件传输代理(MTA) | 第17-19页 |
·邮件分发代理(MDA) | 第19页 |
·电子邮件相关协议 | 第19-23页 |
·简单邮件传输协议(SMTP) | 第19-21页 |
·邮局协议(POP3) | 第21-22页 |
·网络消息访问协议(IMAP) | 第22页 |
·多用途的网际邮件扩充协议(MIME) | 第22-23页 |
·电子邮件的组成 | 第23-24页 |
·垃圾邮件的常用语料库 | 第24-27页 |
·PU1 语料 | 第24-25页 |
·Ling-Spam 语料 | 第25-27页 |
第三章 电子邮件的预处理 | 第27-38页 |
·文本表示方法 | 第27-28页 |
·中文分词 | 第28-32页 |
·中文分词的规范 | 第28页 |
·去除停用词 | 第28-29页 |
·中文分词的常用方法 | 第29-30页 |
·词典的组织加工 | 第30-31页 |
·对正向最大匹配法(FMM)的改进 | 第31-32页 |
·特征项的提取 | 第32-35页 |
·词条权重的计算 | 第35-38页 |
·权重函数的改进 | 第36-37页 |
·本系统所采用的权重函数 | 第37-38页 |
第四章 支持向量机 | 第38-50页 |
·统计学习理论 | 第38-39页 |
·支持向量机 | 第39-44页 |
·线性可分情形 | 第40-41页 |
·线性不可分情形与软间隔 | 第41-42页 |
·线性不可分情形与核函数 | 第42-44页 |
·核函数 | 第44-46页 |
·核函数的作用 | 第45页 |
·参数 C 的作用 | 第45-46页 |
·使用支持向量机方法实现主动学习 | 第46-50页 |
第五章 基于最优搜索的 KNN 最近邻居法 | 第50-60页 |
·KNN 最近邻居法 | 第50-51页 |
·最优搜索理论 | 第51-60页 |
·最优搜索问题的基本要素 | 第52-53页 |
·静止目标最优搜索模型 | 第53-55页 |
·拉格朗日乘数法 | 第55-56页 |
·计算最优搜索策略的算法实现 | 第56-60页 |
第六章 系统实现和测试结果 | 第60-73页 |
·系统设计与实现 | 第60-62页 |
·开发环境介绍 | 第60页 |
·系统结构 | 第60-62页 |
·邮件预处理 | 第62-65页 |
·分词实现 | 第62-63页 |
·特征提取 | 第63-64页 |
·权值计算 | 第64-65页 |
·预处理结果 | 第65页 |
·SVM 分类器的设计 | 第65-67页 |
·SVM 分类器的训练过程 | 第66-67页 |
·SVM 分类器的测试过程 | 第67页 |
·基于最优搜索的 KNN 实现 | 第67-68页 |
·实验结果 | 第68-73页 |
·垃圾邮件的评价体系 | 第68-69页 |
·测试结果 | 第69-73页 |
第七章 总结及展望 | 第73-75页 |
·总结 | 第73页 |
·展望 | 第73-75页 |
致谢 | 第75-76页 |
参考文献 | 第76-78页 |
攻硕期间取得的研究成果 | 第78-79页 |