基于内容的垃圾邮件过滤研究

摘要	第1-5页
Abstract	第5-9页
第一章引言	第9-12页
·背景	第9-11页
·本文的内容安排	第11-12页
第二章垃圾邮件过滤研究现状	第12-18页
·服务器端和客户端的邮件过滤	第12-13页
·白名单和黑名单	第13页
·设定过滤规则	第13-15页
·信头分析	第14-15页
·群发过滤	第15页
·关键词精确匹配	第15页
·邮件内容中的其他特征	第15页
·基于内容的垃圾邮件过滤技术	第15-16页
·垃圾邮件过滤与文本分类	第15-16页
·垃圾邮件过滤与信息过滤	第16页
·小结	第16-18页
第三章垃圾邮件内容过滤技术	第18-30页
·文本分类简介	第18-19页
·特征选择方法	第19-21页
·文档频次	第19页
·互信息	第19页
·信息增益	第19-20页
·χ~2 统计量	第20页
·相对熵	第20-21页
·优势率	第21页
·垃圾邮件内容过滤中应用的文本分类方法	第21-25页
·贝叶斯分类算法	第21-22页
·Memory-Based方法	第22页
·决策树	第22-23页
·Boosting方法	第23-24页
·支持向量机	第24-25页
·垃圾邮件内容过滤中的常用语料库	第25-28页
·PU1 语料	第26-27页
·Ling-Spam语料	第27-28页
·Spam Assassin语料	第28页
·Spambase语料	第28页
·Spamarchive	第28页
·评价体系	第28-29页
·小结	第29-30页
第四章贝叶斯邮件过滤	第30-42页
·贝叶斯方法简介	第30页
·贝叶斯文本分类算法的两种模型	第30-34页
·多变量贝努里事件模型	第32-33页
·多项式事件模型	第33-34页
·贝叶斯算法中的特征选择	第34页
·基于最小风险的贝叶斯决策	第34-35页
·贝叶斯算法应用于垃圾邮件过滤的实验	第35-37页
·实验结果比较与分析	第37-39页
·特征数量对实验结果的影响	第37-39页
·阈值对实验结果的影响	第39页
·语料的预处理层次对实验结果的影响	第39页
·小结	第39-42页
第五章 Winnow算法在垃圾邮件过滤上的应用	第42-51页
·线性分类器	第42-43页
·Winnow分类算法	第43-45页
·错误驱动的在线学习	第43页
·最基本的Winnow算法	第43-44页
·Balanced Winnow	第44-45页
·Winnow在垃圾邮件过滤上的应用	第45-48页
·PU1 语料上的实验	第45-48页
·Ling-Spam语料上的实验	第48页
·结果分析：Winnow的优势	第48-50页
·小结	第50-51页
第六章垃圾邮件过滤中的反馈学习	第51-54页
·Rocchio算法	第51页
·垃圾邮件过滤的反馈学习方法	第51-52页
·增量式学习	第51-52页
·重新学习	第52页
·贝叶斯邮件过滤中的反馈学习技术	第52-53页
·Winnow过滤中的反馈学习技术	第53页
·小结	第53-54页
第七章总结	第54-57页
·一个垃圾邮件过滤系统的设计	第54页
·本文总结	第54-55页
·未来工作	第55-57页
参考文献	第57-62页
致谢	第62-63页
作者简历	第63页