垃圾邮件过滤技术研究

摘要	第1-3页
ABSTRACT	第3-8页
第一章引言	第8-11页
·背景	第8-10页
·本文内容安排	第10-11页
第二章垃圾邮件过滤研究现状	第11-23页
·邮件传输的体系结构	第11-13页
·基于规则的过滤	第13-20页
·黑白名单技术	第13-15页
·反向域名验证	第15页
·发送者身份认证	第15-17页
·SMTP 通信链接速率、频度的设定	第17页
·挑战-响应技术	第17页
·病毒和脚本行为检查	第17-18页
·信头分析	第18-19页
·关键词精确匹配	第19-20页
·综合性规则过滤系统	第20页
·基于统计的垃圾邮件过滤技术	第20-22页
·垃圾邮件过滤与文本分类	第21页
·垃圾邮件过滤与信息过滤	第21-22页
·小结	第22-23页
第三章基于统计的垃圾邮件过滤技术	第23-37页
·文本分类简介	第23-24页
·特征选择方法	第24-26页
·文档频次	第24页
·互信息	第24页
·信息增益	第24-25页
·χ~2 统计量	第25页
·相对熵	第25-26页
·优势率	第26页
·垃圾邮件内容过滤中应用的文本分类方法	第26-31页
·贝叶斯分类算法	第26-27页
·Memory-Based 方法	第27页
·决策树	第27-28页
·Boosting 方法	第28-30页
·支持向量机	第30-31页
·垃圾邮件内容过滤中的常用语料库	第31-35页
·PU1 语料	第32-33页
·Ling-Spam 语料	第33-34页
·Spam Assassin 语料	第34页
·Spambase 语料	第34-35页
·Spamarchive 语料	第35页
·评价体系	第35-36页
·小结	第36-37页
第四章对抗过滤器的技术研究	第37-52页
·向量空间模型的弱点	第37-38页
·干扰器的设计思路	第38-39页
·干扰器的放置位置	第38页
·干扰词的选择	第38-39页
·干扰词插入位置的选择	第39页
·在贝叶斯分类器上的测试	第39-44页
·贝叶斯分类算法	第39-42页
·贝叶斯算法中的特征选择	第42-43页
·贝叶斯垃圾邮件过滤器上的测试	第43-44页
·干扰词法对贝叶斯过滤器的影响测试	第44-49页
·测试系统的设计	第44-45页
·特征数量与抗干扰性能表现	第45-46页
·干扰词选取范围与抗干扰性能表现	第46-48页
·干扰词比例与抗干扰性能表现	第48-49页
·在被干扰的语料上进行训练的测试	第49-51页
·小结	第51-52页
第五章基于TEIRESIAS 和BAYESIAN 的垃圾过滤器	第52-70页
·TEIRESIAS 模式提取算法	第52页
·TEIRESIAS 算法描述	第52-56页
·快速模式匹配	第56-60页
·改进的Aho-Corasick 算法	第57页
·算法描述	第57-60页
·结合TEIRESIAS 的BAYES 过滤器	第60页
·特征权重	第60-61页
·实验结果	第61-62页
·抗干扰性能测试	第62-66页
·加入干扰器的实验结果	第62-64页
·使用被干扰的语料进行训练的实验结果	第64-66页
·针对TEIRESIAS 的干扰测试	第66-69页
·干扰参数与训练参数相同情况下的实验	第66-68页
·干扰参数与训练参数不同情况下的实验	第68-69页
·小结	第69-70页
第六章总结	第70-74页
·本文总结	第70页
·未来工作	第70-74页
攻读硕士学位期间发表的论文	第74-75页
致谢	第75页