基于MapReduce的数据挖掘算法在全国人口系统中的应用

摘要	第4-5页
ABSTRACT	第5页
1 绪论	第8-11页
1.1 课题的研究背景	第8-9页
1.2 课题的来源和研究意义	第9页
1.3 国内外研究现状及分析	第9-10页
1.4 论文的整体结构	第10-11页
2 分布式数据挖掘概述	第11-27页
2.1 数据挖掘概述	第11-16页
2.1.1 数据挖掘算法	第11-13页
2.1.2 分布式数据挖掘	第13-16页
2.2 MapReduce编程模型	第16-19页
2.2.1 MapReduce编程模式原理	第16-17页
2.2.2 MapReduce编程模式的执行过程	第17-19页
2.3 Hadoop分布式框架	第19-26页
2.3.1 分布式文件系统HDFS	第20-24页
2.3.2 Hadoop中MapReduce的工作原理	第24-26页
2.4 本章小结	第26-27页
3 基于MapReduce数据挖掘算法设计	第27-50页
3.1 并行数据挖掘算法设计背景	第27-29页
3.2 并行聚类算法	第29-41页
3.2.1 经典K-means算法分析	第29-30页
3.2.2 并行K-means算法实现	第30-36页
3.2.3 并行K-means算法代码实现	第36-41页
3.3 并行分类算法	第41-44页
3.3.1 经典贝叶斯分类算法分析	第41-42页
3.3.2 并行贝叶斯分类算法设计	第42-44页
3.4 并行关联规则算法	第44-49页
3.4.1 经典FP-Growth算法分析	第45-46页
3.4.2 并行FP-Growth算法设计	第46-49页
3.5 本章小结	第49-50页
4 并行数据挖掘算法在人口系统中的应用	第50-56页
4.1 数据准备	第50-51页
4.2 数据清理	第51-53页
4.3 实验结果及分析	第53-55页
4.3.1 实验环境搭建	第53-54页
4.3.2 实验结果	第54页
4.3.3 实验结果分析	第54-55页
4.4 本章小结	第55-56页
5 总结与展望	第56-57页
致谢	第57-58页
参考文献	第58-60页
在学期间发表的学术论文	第60-61页
详细摘要	第61-68页