垃圾邮件在对抗中的检测

摘要	第1-6页
Abstract	第6-11页
第一章绪论	第11-20页
·垃圾邮件问题的背景	第11-13页
·对抗性垃圾邮件过滤问题	第13-15页
·好词攻击问题描述	第13-14页
·文字模糊攻击问题的具体描述	第14-15页
·基于反馈的垃圾邮件过滤模型	第15-16页
·国内外研究现状	第16-17页
·本文的研究工作	第17-18页
·邮件的表示	第17-18页
·分类器的设计	第18页
·本文结构	第18-19页
·本章小结	第19-20页
第二章邮件特征表示的关键技术	第20-35页
·垃圾邮件过滤的原理	第20-21页
·邮件的特征表示	第21-22页
·常用的特征选择方法	第22-24页
·文档频数	第22页
·信息增益	第22-23页
·卡方统计	第23页
·期望交叉熵	第23-24页
·互信息	第24页
·邮件的预处理	第24-27页
·通过训练集得到词典的过程	第24-26页
·将邮件数据集做成样本集	第26-27页
·垃圾邮件过滤常用的方法	第27-31页
·Bayesian分类器	第27-29页
·SVM分类器	第29-31页
·KNN分类器	第31页
·邮件分类语料库	第31-32页
·性能评价方法	第32-34页
·本章小结	第34-35页
第三章基于TF+SIMILARITY的特征表示和实验对比	第35-54页
·解决单词模糊类邮件的方法	第35-39页
·现有的解决该问题的方法	第35-39页
·自适应的Bayesian分类器	第35-36页
·基于字符级别的K-mers	第36-37页
·隐马尔可夫模型方法	第37-38页
·基于Edit-Distance纠正单词拼写的方法	第38页
·通过Program的方法实现单词还原	第38-39页
·基于TF+SIMILARITY的特征表示方法	第39-46页
·单词模糊类邮件的预处理	第40-43页
·MIME邮件头部和Text/Plain内容的提取	第41页
·SpamDictioanry的获取	第41-42页
·单词模糊类垃圾邮件的预处理步骤	第42-43页
·Edit-distance算法的介绍	第43-44页
·单词相似度(similarity)的计算	第44-45页
·基于similarity和TF的邮件向量空间的表示	第45页
·数据归一化处理	第45-46页
·实验的设计、结果及分析	第46-53页
·实验数据的模拟	第46-47页
·实验对比	第47-53页
·SVM分类器下的分类结果	第47-51页
·Bayesian分类器下的分类结果	第51-52页
·KNN分类器下的分类结果	第52-53页
·本章小结	第53-54页
第四章在线分类模型下动态POOL多分类器的介绍	第54-67页
·动态POOL多分类器应用的引出	第54-55页
·动态多分类器的描述	第55-56页
·邻域的概念	第56-57页
·动态POOL多分类器模型	第57-60页
·训练阶段	第57-58页
·测试阶段	第58-60页
·训练新的分类其的阶段	第60页
·动态POOL多分类器有效性验证实验	第60-62页
·模型在垃圾邮件过滤有效性验证实验设计及结果	第62-66页
·动态Pool垃圾邮件过滤模型的模拟实验设计	第62-64页
·实验结果展示和分析	第64-66页
·本章小结	第66-67页
结论及展望	第67-69页
参考文献	第69-73页
攻读硕士学位期间取得的研究成果	第73-74页
致谢	第74-75页
附件	第75页