首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于内容的垃圾邮件过滤系统研究

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-18页
   ·研究背景和意义第11-12页
   ·垃圾邮件过滤技术研究现状第12-16页
     ·基于规则的过滤第13-15页
     ·基于内容的过滤第15-16页
   ·主要研究内容及章节安排第16-18页
第2章 基于内容的垃圾邮件过滤系统概述第18-30页
   ·特征选择第18-21页
     ·特征频度和文档频度第18-19页
     ·χ2 统计量第19页
     ·信息增益(IG)第19-20页
     ·互信息(MI)第20页
     ·特征熵(TE)第20页
     ·文本证据权(WET)第20-21页
     ·期望交叉熵(ECE)第21页
   ·文本表示第21-25页
     ·布尔模型第22页
     ·向量空间模型(VSM)第22-24页
     ·隐含语义索引模型(LSI)第24-25页
     ·LDA生成模型第25页
   ·垃圾邮件过滤中常用的分类算法第25-29页
     ·K 近邻算法(KNN)第25-26页
     ·支持向量机(SVM)第26-27页
     ·决策树第27-28页
     ·基于数据集的分类器集成第28-29页
   ·垃圾邮件过滤的评价体系第29-30页
第3章 基于内容的垃圾邮件过滤系统预处理第30-36页
   ·中文邮件预处理第30-32页
     ·中文分词第31页
     ·词性选择第31-32页
   ·英文邮件预处理第32-36页
     ·去除信头第32-34页
     ·词根还原和停用词过滤第34-36页
第4章 基于类别信息的LDA特征选择及加权算法第36-54页
   ·LDA生成模型相关知识介绍第36-40页
     ·贝叶斯网络第36-37页
     ·EM算法第37-38页
     ·LDA生成模型第38-40页
   ·基于邮件类别信息的LDA特征选择CLDA算法第40-48页
     ·基于邮件类别信息的LDA特征选择算法CLDA概述第40-41页
     ·LDA模型参数估计第41-42页
     ·实验结果与分析第42-48页
   ·基于LDA模型改进的特征加权Imp-LDA算法第48-54页
     ·算法描述第48-49页
     ·实验结果与分析第49-54页
第5章 基于反馈学习的随机森林算法第54-62页
   ·基于反馈学习的邮件过滤系统第54-56页
   ·随机森林算法在邮件过滤系统中的应用第56-58页
   ·实验结果比较与分析第58-62页
     ·特征数量对邮件过滤系统性能的影响第58-59页
     ·基于反馈学习的随机森林算法的邮件过滤系统性能分析第59-62页
第6章 总结与展望第62-64页
参考文献第64-68页
致谢第68-69页
攻读硕士学位期间取得的科研成果第69页

论文共69页,点击 下载论文
上一篇:基于OGRE的虚拟校园漫游系统的设计与开发
下一篇:基于混合进化的SFL算法及其应用