基于HADOOP的数据挖掘研究

中文摘要	第1-4页
英文摘要	第4-7页
1 绪论	第7-11页
·课题背景及意义	第7-8页
·研究现状	第8-9页
·论文主要工作	第9页
·论文结构简介	第9-11页
2 HADOOP 技术架构研究	第11-26页
·HADOOP 技术背景	第11-13页
·Google 文件系统GFS	第11-13页
·Map/Reduce 编程模式	第13页
·HDFS(HADOOP 分布式文件系统)机制	第13-21页
·前提和设计目标	第14页
·Namenode 和Datanode	第14-15页
·文件系统的名字空间	第15-16页
·数据复制	第16-18页
·文件系统元数据的持久化	第18页
·通讯协议	第18页
·健壮性	第18-19页
·数据组织	第19-21页
·存储空间回收	第21页
·HADOOP MapReduce 编程模型	第21-25页
·操作介绍	第21-23页
·MapReduce 执行流程	第23-24页
·其他关键技术	第24-25页
·本章小结	第25-26页
3 基于 HADOOP 的数据挖掘平台	第26-35页
·数据挖掘技术概述	第26-29页
·数据挖掘发展历程	第26-27页
·数据挖掘技术分类	第27-28页
·数据挖掘流程	第28-29页
·典型数据挖掘系统构成	第29-30页
·基于HADOOP 数据挖掘系统分析和设计	第30-34页
·需求分析	第30-31页
·基本设计思想	第31页
·系统结构模型	第31-33页
·功能模块	第33-34页
·小结	第34-35页
4 SPRINT 并行实现	第35-51页
·SPRINT 算法特征描述	第35-38页
·SPRINT 算法出现背景	第35-36页
·SPRINT 串行算法描述	第36-38页
·SPRINT 算法特征	第38页
·SPRINT 算法并行设计	第38-50页
·并行策略	第38-42页
·算法设计	第42-50页
·算法分析	第50页
·小结	第50-51页
5 实验及评估	第51-61页
·实验平台的搭建	第51-54页
·硬件描述	第51页
·软件描述	第51页
·HADOOP 平台的搭建	第51-54页
·实验过程	第54-56页
·实现效果	第56-60页
·小结	第60-61页
6 结论	第61-63页
·本文工作总结	第61-62页
·未来研究展望	第62-63页
致谢	第63-64页
参考文献	第64-66页
附录	第66页
作者在攻读硕士学位期间发表的论文目录	第66页