基于Hadoop的关联规则算法的研究与改进

中文摘要	第8-10页
ABSTRACT	第10-11页
1 绪论	第12-17页
1.1 课题研究背景及意义	第12-13页
1.1.1 研究背景	第12-13页
1.1.2 研究意义	第13页
1.2 国内外研究现状	第13-15页
1.2.1 对关联规则算法并行改进的研究	第13-14页
1.2.2 云计算研究概览	第14页
1.2.3 基于Hadoop的数据挖掘应用研究	第14-15页
1.3 本文主要工作	第15-16页
1.4 本文组织结构	第16-17页
2 基于Hadoop的数据挖掘系统需求分析	第17-30页
2.1 数据挖掘需求概述	第17-23页
2.1.1 数据挖掘的发展历程	第17-19页
2.1.2 数据挖掘的步骤	第19-21页
2.1.3 数据挖掘的分类及应用	第21-23页
2.2 典型的数据挖掘系统结构	第23-25页
2.3 基于Hadoop的关联规则算法的需求分析	第25-29页
2.3.1 应用需求分析	第25-26页
2.3.2 设计思想分析	第26-27页
2.3.3 系统结构分析	第27-28页
2.3.4 功能模块分析	第28-29页
2.4 本章小结	第29-30页
3 基于Hadoop的关联规则算法设计	第30-34页
3.1 基于Hadoop的关联规则算法改进描述	第30-32页
3.2 基于Hadoop的关联规则算法改进的伪代码描述	第32-33页
3.3 本章小结	第33-34页
4 基于Hadoop的关联规则算法实现	第34-45页
4.1 搭建实验环境	第34-35页
4.1.1 集群配置说明	第34-35页
4.1.2 启动Hadoop	第35页
4.2 实验数据集的准备	第35-38页
4.2.1 数据集清理	第36-37页
4.2.2 数据集导入HDFS	第37-38页
4.3 数据挖掘阶段	第38-41页
4.4 实验结果与其他算法的对比	第41-44页
4.5 本章小结	第44-45页
5 总结与展望	第45-47页
5.1 总结	第45-46页
5.2 展望	第46-47页
参考文献	第47-52页
致谢	第52-53页
攻读学位期间发表的学术论文和参加科研情况	第53-54页
学位论文评阅及答辩情况表	第54页