首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于核偏最小二乘特征提取的垃圾邮件过滤方法的研究

摘要第1-4页
ABSTRACT第4-7页
第一章 引言第7-14页
   ·研究背景和意义第7-8页
     ·垃圾邮件的定义第7-8页
     ·垃圾邮件的现状第8页
     ·垃圾邮件的危害第8页
   ·国内外研究现状第8-12页
     ·基于 IP 地址的过滤方法第9-10页
     ·基于规则的过滤方法第10页
     ·基于内容的过滤技术第10-11页
     ·特征提取方法第11-12页
   ·本文的主要研究内容第12-13页
   ·本文的章节安排第13-14页
第二章 垃圾邮件过滤系统预处理第14-23页
   ·邮件的组成结构以及工作原理第14-17页
     ·邮件的基本结构第14页
     ·邮件的工作原理第14-17页
   ·语料库格式标记的去除第17页
   ·去停用词和词干化第17-18页
   ·中文分词第18-19页
     ·字符串匹配分词第18页
     ·统计分词第18-19页
     ·理解分词第19页
   ·特征选择第19-21页
     ·信息增益第19-20页
     ·期望交叉嫡第20页
     ·互信息第20页
     ·文档频率第20页
     ·χ~2统计第20-21页
   ·文本表示第21-22页
     ·向量空间模型第21页
     ·布尔模型第21页
     ·概率模型第21-22页
     ·语义模型第22页
   ·本章小结第22-23页
第三章 核偏最小二乘特征提取第23-33页
   ·偏最小二乘第23-27页
     ·偏最小二乘概述第23-25页
     ·偏最小二乘的推导过程第25-27页
   ·核偏最小二乘第27-30页
     ·核方法的概念第27-28页
     ·核偏最小二乘第28-30页
   ·主成分分析第30-31页
   ·核主成分分析第31-32页
   ·本章小结第32-33页
第四章 垃圾邮件过滤技术概述第33-39页
   ·支持向量机第33-35页
   ·K 近邻算法第35-36页
   ·最小二乘分类器第36页
   ·决策树算法第36-37页
   ·贝叶斯算法第37-38页
   ·本章小结第38-39页
第五章 实验测试和结果分析第39-52页
   ·实验数据和预处理第39-41页
     ·Spam Assassin 语料库的预处理第40页
     ·TREC 2006 语料库预处理第40-41页
   ·评价方法第41-42页
   ·实验结果和分析第42-51页
   ·本章小结第51-52页
第六章 总结和展望第52-53页
   ·主要工作回顾第52页
   ·本课题今后需进一步研究的地方第52-53页
参考文献第53-56页
个人简历 在读期间发表的学术论文第56-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:信源信道联合编码中关键技术的研究
下一篇:多速率网络控制系统的最优控制研究