基于内容的垃圾邮件过滤系统研究

摘要	第1-6页
Abstract	第6-11页
第1章绪论	第11-18页
·研究背景和意义	第11-12页
·垃圾邮件过滤技术研究现状	第12-16页
·基于规则的过滤	第13-15页
·基于内容的过滤	第15-16页
·主要研究内容及章节安排	第16-18页
第2章基于内容的垃圾邮件过滤系统概述	第18-30页
·特征选择	第18-21页
·特征频度和文档频度	第18-19页
·χ2 统计量	第19页
·信息增益（IG）	第19-20页
·互信息（MI）	第20页
·特征熵（TE）	第20页
·文本证据权（WET）	第20-21页
·期望交叉熵（ECE）	第21页
·文本表示	第21-25页
·布尔模型	第22页
·向量空间模型（VSM）	第22-24页
·隐含语义索引模型（LSI）	第24-25页
·LDA生成模型	第25页
·垃圾邮件过滤中常用的分类算法	第25-29页
·K 近邻算法（KNN）	第25-26页
·支持向量机（SVM）	第26-27页
·决策树	第27-28页
·基于数据集的分类器集成	第28-29页
·垃圾邮件过滤的评价体系	第29-30页
第3章基于内容的垃圾邮件过滤系统预处理	第30-36页
·中文邮件预处理	第30-32页
·中文分词	第31页
·词性选择	第31-32页
·英文邮件预处理	第32-36页
·去除信头	第32-34页
·词根还原和停用词过滤	第34-36页
第4章基于类别信息的LDA特征选择及加权算法	第36-54页
·LDA生成模型相关知识介绍	第36-40页
·贝叶斯网络	第36-37页
·EM算法	第37-38页
·LDA生成模型	第38-40页
·基于邮件类别信息的LDA特征选择CLDA算法	第40-48页
·基于邮件类别信息的LDA特征选择算法CLDA概述	第40-41页
·LDA模型参数估计	第41-42页
·实验结果与分析	第42-48页
·基于LDA模型改进的特征加权Imp-LDA算法	第48-54页
·算法描述	第48-49页
·实验结果与分析	第49-54页
第5章基于反馈学习的随机森林算法	第54-62页
·基于反馈学习的邮件过滤系统	第54-56页
·随机森林算法在邮件过滤系统中的应用	第56-58页
·实验结果比较与分析	第58-62页
·特征数量对邮件过滤系统性能的影响	第58-59页
·基于反馈学习的随机森林算法的邮件过滤系统性能分析	第59-62页
第6章总结与展望	第62-64页
参考文献	第64-68页
致谢	第68-69页
攻读硕士学位期间取得的科研成果	第69页