基于Hadoop平台的并行数据挖掘算法研究

摘要	第5-6页
Abstract	第6页
1 绪论	第11-15页
1.1 论文的研究背景	第11-12页
1.2 研究现状	第12-13页
1.3 论文研究的工作	第13页
1.4 论文的组织结构	第13-15页
2 开源云平台Hadoop及数据挖掘概述	第15-31页
2.1 Hadoop概述	第15-22页
2.1.1 编程模型MapReduce	第16-19页
2.1.2 分布式文件系统HDFS	第19-22页
2.2 数据挖掘简介	第22-28页
2.2.1 数据挖掘概念	第22-23页
2.2.2 数据挖掘过程	第23-26页
2.2.3 分类算法的介绍	第26-28页
2.2.4 聚类算法的介绍	第28页
2.3 透析数据挖掘的未来	第28-29页
2.4 小结	第29-31页
3 高可靠Hadoop数据挖掘平台的构建	第31-45页
3.1 Hadoop平台的搭建	第31-36页
3.1.1 软硬件描述	第31页
3.1.2 搭建基础环境	第31-36页
3.2 安全策略Kerberos配置	第36-40页
3.2.1 Kerberos概述	第36-38页
3.2.2 配置Kerberos	第38-40页
3.3 高可用DRBD配置	第40-42页
3.3.1 DRBD概述	第40-41页
3.3.2 DRBD的配置	第41-42页
3.4 实验的框架设计	第42-43页
3.5 小结	第43-45页
4 基于Hadoop平台的聚类算法的设计与实现	第45-55页
4.1 基于平台聚类算法的设计思想	第45页
4.2 K-Means算法概述	第45-46页
4.3 改进算法的设计与实现	第46-50页
4.4 实验结果	第50-53页
4.5 小结	第53-55页
5 基于Hadoop平台的分类算法的设计及实现	第55-63页
5.1 基于平台分类算法的设计思想	第55页
5.2 朴素贝叶斯分类算法概述	第55-57页
5.2.1 朴素贝叶斯分类原理	第55-57页
5.3 改进的分类算法	第57-59页
5.4 实验结果	第59-61页
5.5 小结	第61-63页
6 总结与展望	第63-65页
6.1 本文总结	第63页
6.2 展望未来	第63-65页
参考文献	第65-69页
致谢	第69-71页
作者简介和主要科研成果	第71页