首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于贝叶斯的中文垃圾邮件过滤系统的设计与实现

摘要第1-5页
Abstract第5-10页
第一章 概述第10-16页
   ·课题研究背景及意义第10-11页
   ·垃圾邮件的危害及当前状况第11-13页
     ·垃圾邮件的定义及其危害第11-12页
     ·我国垃圾邮件的当前状况第12-13页
   ·垃圾邮件的过滤技术第13-14页
   ·论文的创新点第14-15页
   ·论文的内容安排第15-16页
第二章 相关技术简介第16-42页
   ·贝叶斯(Bayes)文本分类技术第16-23页
     ·贝叶斯(Bayes)算法简介第16-17页
     ·贝叶斯算法在垃圾邮件中的应用第17-21页
     ·针对中文邮件的贝叶斯分类技术的研究第21-23页
   ·中文分词的相关概念第23-34页
     ·中文分词的概念、困难、意义及其在邮件过滤系统中的应用第24-26页
     ·基于字符串匹配的分词第26-31页
     ·基于统计的分词第31-32页
     ·基于规则和基于统计相结合第32页
     ·基于理解的分词第32-33页
     ·分词算法总体评测第33-34页
   ·特征选择相关概念及算法第34-40页
     ·特征选择的概念及其算法第35-37页
     ·特征选择算法评测第37-38页
     ·关键字权重第38-40页
   ·本章小结第40-42页
第三章 垃圾邮件“不良信息”的识别第42-60页
   ·垃圾邮件的演变第42-45页
   ·对关键词填充垃圾邮件的研究第45-49页
   ·对同音伪造关键字垃圾邮件的研究第49-53页
   ·对变形关键字垃圾邮件的研究第53-59页
     ·关联分析方法简介第54-55页
     ·基于关联分析技术的潜在特征词挖掘方法第55-59页
   ·本章小结第59-60页
第四章 基于贝叶斯的垃圾邮件过滤系统第60-96页
   ·邮件过滤系统的设计第62-63页
   ·预处理模块第63-67页
     ·邮件头预处理第63-66页
     ·正文附件内容预处理第66-67页
   ·数据词典的设计第67-79页
     ·链表数据字典的设计第67-69页
     ·二级哈希索引词典机制第69-72页
     ·带词缀的索引词典机制第72-76页
     ·三种词典机制的分析比较第76-79页
   ·分词模块第79-89页
     ·分词算法思想第79-80页
     ·改进的基于字符串的分词算法第80-84页
     ·未登录词的处理算法第84-89页
   ·分词结果集筛选模块第89-95页
     ·邮件协议分析第90-91页
     ·去除停用词第91-92页
     ·首次特征选择第92-94页
     ·二次特征选择第94-95页
   ·本章小结第95-96页
第五章 测试第96-106页
   ·系统的性能测试第96-98页
   ·中文分词模块的性能测试第98-103页
   ·特征选择模块的性能测试第103-104页
   ·本章小节第104-106页
第六章 总结与展望第106-108页
   ·总结第106-107页
   ·展望第107-108页
参考文献第108-111页
致谢第111-112页
攻硕期间取得的研究成果第112-113页

论文共113页,点击 下载论文
上一篇:嵌入式Linux的研究与优化
下一篇:颜色和纹理特征在图像检索中的应用