首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于内容的垃圾邮件过滤技术的研究

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-16页
   ·问题的提出第9-11页
     ·垃圾邮件的定义第9页
     ·垃圾邮件的危害第9-10页
     ·研究的背景及研究意义第10-11页
   ·国内外研究现状第11-15页
     ·在基于规则的内容过滤方法研究方面第12-14页
     ·国内研究状况分析第14-15页
   ·论文的主要内容及章节安排第15-16页
第二章 文本数据挖掘技术第16-29页
   ·数据挖掘与文本数据挖掘第16-18页
     ·数据挖掘介绍第16-17页
     ·文本数据挖掘第17-18页
   ·文本数据挖掘目的第18-19页
   ·文本分类技术应用研究第19-27页
     ·文本分类方法概述第19-21页
     ·文本分类主要算法的基本概念和基本原理第21-27页
   ·垃圾邮件与文本分类第27-28页
   ·小结第28-29页
第三章 邮件文本的分类技术第29-38页
   ·过滤系统的总体设计思路第29页
   ·中文分词概念第29-31页
   ·分词方法第31-33页
     ·基于词典的字符串匹配分词方法第31-32页
     ·基于理解的分词方法第32页
     ·基于统计的分词方法第32页
     ·本文中分词采用的方法第32-33页
   ·文本分类中常用特征值的提取方法第33-36页
     ·文档频率第34页
     ·互信息量第34-35页
     ·信息增益第35-36页
     ·相对嫡法第36页
   ·本文提出的特征选取算法第36页
   ·文本的表示第36-37页
   ·本章小结第37-38页
第四章 多分类器组合的过滤系统设计第38-49页
   ·分类器组合的方法第38-40页
     ·Bagging 与Boosting第38-40页
     ·投票表决法和加权投票法第40页
   ·邮件过滤系统的设计第40-42页
   ·单一分类器的实现第42-45页
     ·贝叶斯算法第42-43页
     ·朴素贝叶斯算法第43-44页
     ·KNN 算法第44-45页
     ·基于汉明距离的KNN 算法第45页
   ·组合过滤器的实现第45-48页
     ·中文分词的设计第46-48页
     ·垃圾邮件算法步骤第48页
   ·本章小结第48-49页
第五章 实验测试及结果分析第49-53页
   ·系统实验测试第49-51页
     ·邮件语料库第49页
     ·测试平台总体设计第49页
     ·测试环境第49-50页
     ·测试评估指标第50-51页
   ·实验结果及分析第51-52页
   ·小结第52-53页
第六章 总结与展望第53-55页
   ·总结第53页
   ·今后的工作第53-55页
致谢第55-56页
参考文献第56-58页

论文共58页,点击 下载论文
上一篇:聚类技术在网络入侵检测中的研究与应用
下一篇:税收征管信息系统登陆安全控件设计与开发