基于内容的垃圾邮件过滤技术的若干研究

声明	第1页
论文版权使用授权书	第2-3页
摘要	第3-4页
英文摘要	第4-5页
目录	第5-8页
第一章引言	第8-12页
·背景	第8-9页
·对付垃圾邮件的方法简介	第9-10页
·论文的主要研究内容	第10页
·本文的内容安排	第10-12页
第二章基于内容的垃圾邮件过滤	第12-26页
·文本表示方法	第12-14页
·特征选择	第14页
·垃圾邮件过滤中常用的机器学习算法	第14-18页
·基于规则的方法	第14-16页
·Ripper	第15页
·决策树方法(Decision Tree)	第15页
·PART方法	第15页
·Boosting方法	第15-16页
·基于统计的方法	第16-18页
·kNN方法	第16页
·SVM	第16页
·Rocchio方法	第16-17页
·Winnow方法	第17页
·Bayes方法	第17-18页
·邮件过滤语料库	第18-20页
·SpamAssassin语料	第18-19页
·PU系列语料	第19页
·Ling-Spam语料	第19页
·其他语料	第19-20页
·评价体系	第20-24页
·沿用传统文本分类的评价体系	第20-21页
·ROC评价方法	第21-24页
·小结	第24-26页
第三章多特征垃圾邮件过滤	第26-44页
·邮件特征的分类	第26-27页
·节点特征	第27-30页
·短语特征	第27-28页
·模式特征	第28-29页
·有关节点特征的使用	第29-30页
·属性特征	第30-42页
·属性特征的分类效果	第31-34页
·属性特征与传统文本特征的结合	第34-38页
·特征选择	第38-42页
·小结	第42-44页
第四章基于结构的双层SPAM过滤模型	第44-60页
·样本结构分布对分类的影响	第44-49页
·文档频率DF在不同文件长度(结构)语料集中的分布	第44-45页
·特征信息增益在不同长度(结构)文档集中的分布	第45-49页
·基于结构的双层SPAM分类模型	第49-50页
·SBF模型的效果分析	第50-57页
·在SpamAssassin语料库上的实验结果	第50-53页
·在Enron和SpamArchive的混合语料库上的结果	第53-56页
·Na(?)ve Bayes效果分析	第56-57页
·如何划分层次	第57-58页
·小结	第58-60页
第五章基于内容的垃圾邮件过滤的实用性研究	第60-70页
·放在服务器上的客户端过滤器	第60-64页
·基于内容的垃圾邮件过滤的实用情况分析	第60-61页
·用户个性化的服务器端过滤器	第61-64页
·用户个性化信息建模	第64-67页
·用户个性化的过滤系统模型	第64-65页
·用户个性化信息的获取	第65-66页
·个性化信息的表示	第66-67页
·增量式学习	第67-69页
·小结	第69-70页
第六章总结	第70-72页
·论文工作总结	第70页
·下一步研究方向	第70-72页
参考文献	第72-79页
作者简历	第79页