Hadoop平台垃圾邮件过滤算法研究与实现

摘要	第6-7页
abstract	第7页
第1章绪论	第10-17页
1.1 研究的背景及意义	第10-12页
1.2 国内外研究现状	第12-14页
1.3 研究的主要内容	第14-15页
1.4 论文组织结构	第15-16页
1.5 本章小结	第16-17页
第2章邮件过滤技术	第17-30页
2.1 数据挖掘关键技术研究	第17-20页
2.1.1 数据挖掘概述	第17-18页
2.1.2 数据挖掘发展历程	第18页
2.1.3 数据挖掘常用的方法	第18-20页
2.2 中文邮件文本信息预处理	第20-23页
2.2.1 中文分词的主要方法	第20-22页
2.2.2 特征词提取	第22-23页
2.3 Hadoop分布式平台分析	第23-29页
2.3.1 HDFS分布式文件系统分析	第23-26页
2.3.2 MapReduce框架分析	第26-29页
2.4 本章小结	第29-30页
第3章 Hadoop平台贝叶斯算法分类研究	第30-45页
3.1 贝叶斯技术原理	第30-33页
3.1.1 贝叶斯技术历史概述	第30页
3.1.2 贝叶斯相关定义和公式	第30-33页
3.2 朴素贝叶斯文本分类	第33-38页
3.2.1 两种分类器	第33-36页
3.2.2 两种事件模型	第36-38页
3.3 朴素贝叶斯算法在邮件过滤中的应用	第38-44页
3.3.1 模型构建	第38-39页
3.3.2 朴素贝叶斯算法的优缺点	第39-40页
3.3.3 模型优化	第40-44页
3.4 本章小结	第44-45页
第4章 Hadoop平台邮件过滤流程设计	第45-59页
4.1 MapReduce分布式编程模型	第45页
4.2 优化算法的MapReduce模型	第45-52页
4.2.1 朴素贝叶斯邮件过滤算法设计	第45-47页
4.2.2 MapReduce模型的邮件预处理模块	第47-51页
4.2.3 MapReduce模型的邮件训练模块	第51-52页
4.2.4 MapReduce模型的邮件过滤模块	第52页
4.3 实验环境搭建	第52-58页
4.3.1 Hadoop云计算平台	第52-53页
4.3.2 Hadoop平台搭建流程	第53-58页
4.4 本章小结	第58-59页
第5章实验结果及其分析	第59-65页
5.1 实验语料	第59页
5.2 数据评价指标	第59-60页
5.3 实验结果展示	第60-62页
5.4 实验结果分析	第62-64页
5.5 本章小结	第64-65页
结论	第65-67页
参考文献	第67-71页
攻读硕士学位期间发表的论文和获得的科研成果	第71-72页
致谢	第72-73页