基于贝叶斯算法的垃圾邮件过滤系统的研究与设计
摘要 | 第1-4页 |
Abstract | 第4-8页 |
第一章 垃圾邮件概述 | 第8-13页 |
·垃圾邮件的定义 | 第8页 |
·垃圾邮件的特征 | 第8-9页 |
·垃圾邮件的类型 | 第9页 |
·垃圾邮件产生的原因 | 第9-11页 |
·商业上的原因 | 第9页 |
·技术上的原因 | 第9-10页 |
·法律上的原因 | 第10页 |
·政治上的原因 | 第10页 |
·黑客的原因 | 第10页 |
·发送垃圾邮件的成本的原因 | 第10-11页 |
·意识的原因 | 第11页 |
·国内垃圾邮件的现状 | 第11页 |
·垃圾邮件的危害 | 第11-13页 |
第二章 垃圾邮件过滤技术 | 第13-15页 |
·黑白名单技术 | 第13页 |
·反向域名验证 | 第13页 |
·关键词过滤 | 第13-14页 |
·基于规则评分的过滤技术 | 第14页 |
·贝叶斯过滤法 | 第14-15页 |
第三章 基于贝叶斯算法的垃圾邮件过滤技术 | 第15-22页 |
·贝叶斯定理 | 第15-16页 |
·贝叶斯分类器 | 第16-17页 |
·朴素贝叶斯分类器 | 第17页 |
·贝叶斯算法的应用实例 | 第17-21页 |
·基于贝叶斯算法的垃圾邮件过滤流程 | 第21-22页 |
第四章 电子邮件的报文格式及解析 | 第22-27页 |
·电子邮件的报文格式 | 第22-24页 |
·RFC822文本式邮件报文 | 第22-23页 |
·MIME格式的邮件报文 | 第23-24页 |
·邮件内容的解析 | 第24-27页 |
·Base64的解码 | 第24-25页 |
·Quloted-printable解码 | 第25页 |
·邮件内容的解析算法 | 第25-27页 |
第五章 基于贝叶斯方法的垃圾邮件过滤系统的实现 | 第27-41页 |
·总统设计 | 第27-29页 |
·贝叶斯方法的具体实现 | 第27页 |
·系统总统设计分析 | 第27-28页 |
·数据库的设计 | 第28-29页 |
·邮件内容解析模块 | 第29-30页 |
·邮件内容解析 | 第29-30页 |
·HTML邮件的内容提取 | 第30页 |
·关键词提取模块 | 第30-36页 |
·汉语词法分析系统 ICTCLAS | 第31-32页 |
·关键词的提取 | 第32-36页 |
·处理停用词模块 | 第36-38页 |
·构造停词表 | 第36-38页 |
·处理停用词 | 第38页 |
·建立统计表模块 | 第38页 |
·关键词概率计算模块 | 第38页 |
·重新学习模块 | 第38-39页 |
·邮件判定预处理模块 | 第39页 |
·邮件判定模块 | 第39页 |
·系统运行界面 | 第39-41页 |
第六章 实验测试 | 第41-43页 |
·实验环境的搭建 | 第41页 |
·测试的结果 | 第41-42页 |
·对比测试 | 第42-43页 |
第七章 结束语 | 第43-44页 |
参考文献 | 第44-47页 |
在校期间的研究成果及发表的学术论文 | 第47-48页 |
致谢 | 第48页 |