基于内容的邮件过滤技术研究

摘要	第1-5页
Abstract	第5-6页
目录	第6-9页
1 绪论	第9-15页
·研究背景	第9-11页
·垃圾邮件的起源与历史	第11-12页
·垃圾邮件的定义与泛滥原因	第12页
·反垃圾邮件法律和政策	第12-14页
·本文内容	第14-15页
2 电子邮件的原理	第15-20页
·电子邮件的格式	第15页
·电子邮件的传送过程	第15-17页
·电子邮件代理	第15-16页
·电子邮件的传送过程	第16-17页
·电子邮件的相关协议	第17-19页
·SMTP协议	第17-18页
·MIME协议	第18页
·POP协议	第18-19页
·IMAP协议	第19页
·本章小结	第19-20页
3 邮件过滤技术	第20-29页
·垃圾邮件过滤的位置	第20页
·基干IP地址的垃圾邮件过滤	第20-21页
·基于邮件头的垃圾邮件过滤	第21-22页
·基于内容的垃圾邮件过滤	第22-27页
·文本分类与垃圾邮件过滤	第22-23页
·信息过滤	第23页
·基于规则的过滤方法	第23-24页
·基于统计的过滤方法	第24-27页
·垃圾邮件内容过滤中的常用语料库	第27页
·其它过滤方法	第27-28页
·本章小结	第28-29页
4 邮件预处理与特征选取算法	第29-36页
·邮件预处理	第29-32页
·邮件正文提取	第29页
·邮件分词	第29-30页
·英文分词	第29-30页
·中文分词	第30页
·邮件表示	第30-32页
·向量空间模型	第30-31页
·项的确定	第31页
·项的权重	第31-32页
·各种特征选取算法	第32-35页
·特征选取算法	第33-35页
·文档频率	第33页
·信息增益	第33-34页
·互信息	第34页
·相对熵	第34页
·词条强度	第34-35页
·开放拟合检验	第35页
·各种特征选取算法的比较	第35页
·本章小结	第35-36页
5 贝叶斯邮件过滤	第36-49页
·贝叶斯方法简介	第36页
·贝叶斯文本分类算法的两种模型	第36-40页
·多变量Bernoulli事件方法	第38-39页
·多项式事件方法	第39-40页
·贝叶斯算法中的特征选择	第40-41页
·基于最小风险的贝叶斯决策	第41-42页
·贝叶斯算法应用于垃圾邮件过滤的实验	第42-44页
·实验结果比较与分析	第44-48页
·特征数量对实验结果的影响	第44-46页
·阈值对实验结果的影响	第46页
·语料的预处理层次对实验结果的影响	第46-48页
·本章小结	第48-49页
6 邮件过滤算法的设计与实现	第49-59页
·kNN和Rocchio算法用于邮件过滤的研究	第49-51页
·kNN和Rocchio算法用于邮件过滤的设计与实现	第51-54页
·训练及过滤过程的设计与实现	第51-54页
·邮件样本集的选取	第51页
·训练过程	第51-52页
·过滤过程	第52-54页
·算法方法中的反馈学习技术	第54-58页
·算法的不足和互补	第54-55页
·算法的改进	第55-56页
·实验结果及分析	第56-58页
·实验数据的选取	第56-57页
·实验数据及分析	第57-58页
·本章小结	第58-59页
结论	第59-60页
参考文献	第60-63页
攻读工程硕士学位期间发表的论文和取得的科研成果	第63-64页
致谢	第64页