首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于内容的垃圾邮件过滤技术的若干研究

声明第1页
论文版权使用授权书第2-3页
摘要第3-4页
英文摘要第4-5页
目录第5-8页
第一章 引言第8-12页
   ·背景第8-9页
   ·对付垃圾邮件的方法简介第9-10页
   ·论文的主要研究内容第10页
   ·本文的内容安排第10-12页
第二章 基于内容的垃圾邮件过滤第12-26页
   ·文本表示方法第12-14页
   ·特征选择第14页
   ·垃圾邮件过滤中常用的机器学习算法第14-18页
     ·基于规则的方法第14-16页
       ·Ripper第15页
       ·决策树方法(Decision Tree)第15页
       ·PART方法第15页
       ·Boosting方法第15-16页
     ·基于统计的方法第16-18页
       ·kNN方法第16页
       ·SVM第16页
       ·Rocchio方法第16-17页
       ·Winnow方法第17页
       ·Bayes方法第17-18页
   ·邮件过滤语料库第18-20页
     ·SpamAssassin语料第18-19页
     ·PU系列语料第19页
     ·Ling-Spam语料第19页
     ·其他语料第19-20页
   ·评价体系第20-24页
     ·沿用传统文本分类的评价体系第20-21页
     ·ROC评价方法第21-24页
   ·小结第24-26页
第三章 多特征垃圾邮件过滤第26-44页
   ·邮件特征的分类第26-27页
   ·节点特征第27-30页
     ·短语特征第27-28页
     ·模式特征第28-29页
     ·有关节点特征的使用第29-30页
   ·属性特征第30-42页
     ·属性特征的分类效果第31-34页
     ·属性特征与传统文本特征的结合第34-38页
     ·特征选择第38-42页
   ·小结第42-44页
第四章 基于结构的双层SPAM过滤模型第44-60页
   ·样本结构分布对分类的影响第44-49页
     ·文档频率DF在不同文件长度(结构)语料集中的分布第44-45页
     ·特征信息增益在不同长度(结构)文档集中的分布第45-49页
   ·基于结构的双层SPAM分类模型第49-50页
   ·SBF模型的效果分析第50-57页
     ·在SpamAssassin语料库上的实验结果第50-53页
     ·在Enron和SpamArchive的混合语料库上的结果第53-56页
     ·Na(?)ve Bayes效果分析第56-57页
   ·如何划分层次第57-58页
   ·小结第58-60页
第五章 基于内容的垃圾邮件过滤的实用性研究第60-70页
   ·放在服务器上的客户端过滤器第60-64页
     ·基于内容的垃圾邮件过滤的实用情况分析第60-61页
     ·用户个性化的服务器端过滤器第61-64页
   ·用户个性化信息建模第64-67页
     ·用户个性化的过滤系统模型第64-65页
     ·用户个性化信息的获取第65-66页
     ·个性化信息的表示第66-67页
   ·增量式学习第67-69页
   ·小结第69-70页
第六章 总结第70-72页
   ·论文工作总结第70页
   ·下一步研究方向第70-72页
参考文献第72-79页
作者简历第79页

论文共79页,点击 下载论文
上一篇:原型水轮机全流道计算及计算精度分析
下一篇:卫星通信网络接入切换和信道分配策略研究