首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于内容挖掘的垃圾邮件过滤技术

第1章 引言第1-13页
   ·研究的意义第10页
   ·国内外的研究现状第10-11页
   ·本课题研究的主要内容第11-13页
     ·邮件的采集与预处理第11页
     ·文本分词第11页
     ·特征选取第11-12页
     ·贝叶斯分类器第12-13页
第2章 总体设计第13-15页
   ·功能模块第13页
   ·开发平台及开发语言的选择第13-14页
     ·采用的开发平台第13-14页
     ·采用的开发语言第14页
   ·本课题的创新点第14-15页
第3章 邮件采集与预处理第15-33页
   ·Email系统工作原理第15-17页
   ·JavaMail API第17-22页
     ·JavaMail API简介第17页
     ·JavaMail API所涉及的相关协议第17-18页
     ·JavaMail核心类结构第18-22页
   ·使用 JavaMail API实现邮件收发及内容采集第22-26页
     ·发送邮件第22-23页
     ·接收邮件第23-24页
     ·邮件内容采集第24-25页
     ·邮件中 HTML内容的显示处理第25-26页
   ·邮件预处理第26-33页
     ·在邮件中搜索短语第26-27页
     ·HTML标记处理第27-33页
       ·超文本标记语言(HTML)第27-28页
       ·HTML中的重要标记第28页
       ·HTML解析第28-31页
       ·邮件预处理的实现第31-33页
第4章 中文分词的实现及中文词典第33-40页
   ·中文分词概述第33-34页
   ·中文分词方法第34-37页
     ·基于字典、词库匹配的分词方法(机械分词法)第34-36页
       ·正向最大匹配法(MM)第34-36页
     ·基于词的频度统计的分词方法第36页
     ·基于知识理解的分词方法第36-37页
     ·本课题中分词采用的方法第37页
   ·中文词典及其存储结构第37-38页
   ·中文切分第38-40页
第5章 各特征选取算法比较及本课题采取的选取算法第40-47页
   ·特征选取算法第41-44页
     ·文档频率第41页
     ·信息增益第41页
     ·互信息第41-42页
     ·term的某种熵第42页
     ·相对熵第42页
     ·词条强度法第42-43页
     ·开放拟合检验(CHI)第43-44页
   ·各特征选取算法的比较第44-45页
   ·本课题提出的特征选取算法第45-46页
   ·改进后的互信息方法与其他特征选取算法的比较第46-47页
第6章 各邮件过滤方法的比较与 NB分类器的实现第47-65页
   ·基于规则的方法第47-49页
     ·Ripper第48页
     ·决策树方法(Decision Tree)第48页
     ·Boosting方法第48-49页
     ·Rough Set方法第49页
   ·基于统计的方法第49-52页
     ·kNN方法第49页
     ·SVM第49-50页
     ·Rocchio方法第50页
     ·Winnow方法第50-51页
     ·Bayes方法第51-52页
   ·贝叶斯方法与文本分类第52页
   ·Naive贝叶斯分类器第52-55页
     ·Naive贝叶斯方法第52-53页
     ·概率估计第53-54页
     ·贝叶斯分类器第54-55页
   ·贝叶斯分类器的实现第55-65页
第7章 结论评价及展望第65-73页
   ·系统总体结构图第65-66页
   ·系统各模块运行界面第66-69页
   ·系统实验结果的质量评价体系第69-71页
   ·邮件分类实验及其实验结果讨论第71页
   ·进一步研究的展望第71-73页
参考文献第73-76页
致谢第76-77页
攻读硕士学位期间发表论文情况第77页

论文共77页,点击 下载论文
上一篇:小学科学教学中创造性思维的培养
下一篇:基于网络环境的医药卫生科技查新质量控制方法