垃圾邮件过滤技术研究

摘要	第1-12页
ABSTRACT	第12-14页
1 绪论	第14-18页
·研究背景	第14-15页
·反垃圾邮件的相关工作	第15-16页
·反垃圾邮件相关技术和系统	第15页
·反垃圾邮件组织、会议和评测	第15-16页
·相关数据集	第16页
·本文工作	第16-17页
·本文组织	第17-18页
2 电子邮件基础和反垃圾邮件技术介绍	第18-30页
·电子邮件的原理	第18-26页
·体系结构	第18页
·电子邮件发送的基本过程	第18-19页
·SMTP	第19-20页
·Open Relay	第20-21页
·POP3与IMAP	第21-22页
·电子邮件的格式	第22-24页
·MIME协议	第24-26页
·反垃圾邮件技术与垃圾邮件过滤技术	第26-29页
·基于关键字的过滤	第26页
·黑白名单与实时黑名单	第26-27页
·反向DNS查询	第27页
·信头特征分析	第27页
·内容特征分析	第27-28页
·基于内容的机器学习过滤技术	第28页
·综合各种技术	第28-29页
·本章小结	第29-30页
3 垃圾邮件过滤与文本分类	第30-50页
·文本分类简介	第30-36页
·文本分类的形式化定义	第30-31页
·文档模型	第31页
·特征权重计算	第31-32页
·特征选择	第32-34页
·中文词串切分	第34-36页
·文本分类中常用的分词算法	第34-36页
·N元切分	第36页
·停用词与标点符号	第36页
·用于文本分类的机器学习算法	第36-41页
·朴素贝叶斯方法	第37页
·KNN分类模型	第37-38页
·支持向量机	第38-41页
·决策树算法	第41页
·基于内容的垃圾邮件过滤技术	第41-44页
·基本框架	第41-42页
·分类算法对过滤效果的影响	第42-43页
·降维与特征选择	第43页
·垃圾邮件过滤与中文分词算法	第43-44页
·实验	第44-49页
·实验硬件和软件环境	第44页
·使用的数据集	第44-45页
·评价体系	第45-46页
·实验结果及分析	第46-49页
·本章小结	第49-50页
4 基于链接特征分析的垃圾邮件过滤技术	第50-58页
·引言	第50页
·用链接分析进行判别	第50-52页
·特征列表	第52-53页
·区分广告与垃圾	第53-54页
·分类器与特征选择	第54页
·实验结果及分析	第54-57页
·本章小结	第57-58页
5 基于改进AdaBoost算法的多过滤技术组合策略	第58-69页
·Adaboost算法介绍	第58-60页
·弱学习与强学习	第58-59页
·Boosting方法	第59页
·AdaBoost算法原理	第59-60页
·用改进的AdaBoost算法进行多过滤技术组合	第60-65页
·改进的AdaBoost算法	第60-62页
·学习弱规则	第62-65页
·基于规则的技术的弱规则的学习	第62-64页
·基于机器学习的技术的弱规则的学习	第64-65页
·先验概率的问题	第65页
·分析	第65页
·其他的组合策略	第65-67页
·实验结果及分析	第67-68页
·本章小结	第68-69页
6 结论和进一步的工作	第69-71页
·结论	第69-70页
·进一步的工作	第70-71页
参考文献	第71-74页
致谢	第74-75页
攻读硕士学位期间发表的学术论文	第75-76页
学位论文评阅及答辩情况表	第76页