基于SVM的中文垃圾邮件的识别研究

摘要	第1-7页
Abstract	第7-12页
1 引言	第12-16页
·研究背景及选题意义	第12-13页
·研究背景	第12页
·选题意义	第12-13页
·研究现状	第13-15页
·反垃圾邮件技术	第13-14页
·支持向量机的研究	第14-15页
·主要内容及框架结构	第15-16页
·主要内容	第15页
·框架结构	第15-16页
2 中文邮件相关知识	第16-21页
·电子邮件的特点	第16-17页
·中文垃圾邮件的概念	第17-18页
·中文垃圾邮件识别过程及相关技术	第18-21页
·中文垃圾邮件识别过程	第18页
·相关技术	第18-21页
3 中文邮件文本分词预处理	第21-26页
·中文文本自动分词	第21页
·自动分词词典机制	第21-22页
·基于词典的分词方法――改进的正向最大匹配法	第22-26页
·改进的正向最大匹配法算法思路	第22-23页
·算法实现过程	第23页
·实验与分析	第23-26页
4 中文邮件向量空间模型	第26-31页
·向量空间模型	第26页
·特征项	第26-31页
·特征项的权值	第26-27页
·向量空间的降维	第27-30页
·实验与分析	第30-31页
5 支持向量机分类算法	第31-45页
·统计学习理论	第31-32页
·直观相似程度与内积	第31-32页
·经验风险最小化归纳原则	第32页
·支持向量机算法原理	第32-36页
·线性可分支持向量机	第33-35页
·线性不可分支持向量机	第35-36页
·线性支持向量分类机算法	第36页
·支持向量机训练算法	第36-45页
·选块算法	第37-38页
·分解算法	第38-40页
·序列最小最优化算法	第40-45页
6 中文垃圾邮件的识别	第45-50页
·中文垃圾邮件特征提取模型的设计	第45-47页
·训练集的选取	第46页
·算法选择	第46页
·核函数的选取	第46-47页
·中文垃圾邮件特征提取与识别	第47-50页
·数据资源	第47页
·结果分析	第47-50页
7 结论与展望	第50-51页
·结论	第50页
·展望	第50-51页
参考文献	第51-53页
附录一中文邮件文本分词部分程序代码	第53-56页
附录二中文邮件文本向量表示部分程序代码	第56-57页
附录三中文垃圾邮件特征提取部分程序代码	第57-58页
致谢	第58-59页
攻读硕士学位期间发表的论文	第59-60页