基于数据挖掘的垃圾邮件过滤技术研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-13页
·研究的背景及研究意义	第9-10页
·目前国内外研究现状	第10-12页
·存在的问题	第10-11页
·主要技术	第11-12页
·本文研究的主要内容及章节安排	第12-13页
第二章数据挖掘技术	第13-21页
·数据挖掘概念和任务	第13-15页
·数据挖掘的概念	第13-14页
·数据挖掘的任务	第14-15页
·数据挖掘的过程、模式和方法	第15-18页
·数据挖掘的过程	第15-16页
·数据挖掘的模式和方法	第16-18页
·文本数据挖掘	第18-21页
第三章基于内容的反垃圾邮件技术应用研究	第21-29页
·概述	第21页
·KNN(K-Nearest Neighbor)算法及其模型	第21-23页
·基于汉明距离的K-最近邻算法	第23-25页
·贝叶斯算法及其模型	第25-26页
·向量空间(VSM)算法及其模型	第26-27页
·朴素贝叶斯算法及模型	第27-28页
·小结	第28-29页
第四章邮件过滤系统的预处理	第29-35页
·邮件过滤系统的总体设计	第29-30页
·文本的表示	第30页
·中文分词技术	第30-32页
·基于词典的字符串匹配分词方法	第30-31页
·基于理解的分词方法	第31页
·基于统计的分词方法	第31页
·本文中分词采用的方法	第31-32页
·特征值提取	第32-34页
·文档频率	第32页
·互信息量	第32-33页
·信息增益	第33页
·相对熵法	第33页
·本文提出的特征选取算法	第33-34页
·小结	第34-35页
第五章基于多分类器组合的垃圾邮件过滤系统的设计	第35-48页
·概述	第35页
·分类器组合的方法	第35-38页
·投票表决法和加权投票法	第35-36页
·Bagging与Boosting	第36-38页
·垃圾邮件过滤系统设计与实现	第38-39页
·垃圾邮件过滤系统设计	第38-39页
·垃圾邮件算法步骤	第39页
·单一过滤器的实现	第39-45页
·KNN算法	第40-41页
·贝叶斯算法	第41-42页
·基于汉明距离的KNN算法	第42-43页
·朴素贝叶斯算法	第43-45页
·组合过滤器的实现	第45-46页
·组合分类器的模型算法	第46-47页
·本章小结	第47-48页
第六章实验测试	第48-51页
·系统性能测试	第48-49页
·测试目的	第48页
·测试评价指标	第48-49页
·实验结果及分析	第49-50页
·小结	第50-51页
第七章结束语	第51-53页
·总结	第51页
·展望	第51-53页
致谢	第53-54页
参考文献	第54-57页