摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-15页 |
·课题来源 | 第10页 |
·课题背景及研究意义 | 第10-11页 |
·垃圾邮件过滤技术研究现状 | 第11-14页 |
·本文主要内容及章节安排 | 第14-15页 |
第2章 电子邮件原理及文本分类技术 | 第15-26页 |
·邮件的传输过程 | 第15-16页 |
·常见的电子邮件协议 | 第16-17页 |
·电子邮件的报文格式 | 第17-19页 |
·电子邮件的解析过程 | 第19-20页 |
·文本分类 | 第20-25页 |
·文本表示 | 第20-22页 |
·中文分词 | 第22-23页 |
·文本特征项提取 | 第23-25页 |
·本章小结 | 第25-26页 |
第3章 基于支持向量机的垃圾邮件过滤技术 | 第26-36页 |
·支持向量机理论 | 第26-31页 |
·理论背景 | 第26-27页 |
·支持向量机的思想和原理 | 第27-29页 |
·常见的核函数 | 第29-30页 |
·核函数作用及核参数的影响 | 第30页 |
·支持向量机方法的优点 | 第30-31页 |
·改进的SVM 算法 | 第31-33页 |
·基于SVM 算法的常见实现 | 第31-32页 |
·LIBSVM | 第32-33页 |
·将SVM 理论用于垃圾邮件处理 | 第33-34页 |
·SVM 模型建立 | 第34-35页 |
·本章小结 | 第35-36页 |
第4章 垃圾邮件过滤系统的预处理 | 第36-50页 |
·垃圾邮件的新形式 | 第36-37页 |
·针对HTML 格式垃圾邮件的处理 | 第37-42页 |
·基于HTML 结构特征的正文信息提取 | 第37-41页 |
·基于URL 黑名单的链接类垃圾邮件过滤 | 第41-42页 |
·中文分词 | 第42-46页 |
·建立停用词表 | 第42-43页 |
·建立基于词性和专业性的中英文分词词典 | 第43-44页 |
·运用开源软件包Lucene 和GATE 进行分词 | 第44页 |
·分词实现过程 | 第44-46页 |
·基于相似度曲线的特征提取 | 第46-49页 |
·本章小结 | 第49-50页 |
第5章 基于SVM 的垃圾邮件过滤模型实现 | 第50-60页 |
·SVM 训练 | 第50-53页 |
·邮件样本集的选取 | 第50页 |
·训练调参 | 第50-51页 |
·训练步骤 | 第51-53页 |
·分类过程的设计与实现 | 第53-55页 |
·仿真实验 | 第55-59页 |
·软硬件环境 | 第55页 |
·垃圾邮件过滤系统的评价体系 | 第55-56页 |
·实验结果及分析 | 第56-59页 |
·本章小结 | 第59-60页 |
结论 | 第60-61页 |
附录 | 第61-64页 |
参考文献 | 第64-68页 |
攻读硕士学位期间发表的学术论文 | 第68-69页 |
致谢 | 第69页 |