基于弹性分布式数据集的流数据聚类分析

摘要	第1-7页
ABSTRACT	第7-12页
第1章绪论	第12-16页
·研究背景	第12页
·流数据挖掘的研究现状	第12-14页
·研究成果	第12-13页
·存在的问题	第13-14页
·本文的主要研究内容	第14-15页
·本文结构	第15-16页
第2章聚类分析概述	第16-27页
·数据挖掘技术	第16-18页
·数据挖掘的概念	第16页
·数据挖掘的过程	第16-18页
·流数据挖掘	第18-19页
·流数据的定义及特点	第18页
·流数据挖掘的特点	第18-19页
·一般聚类分析概述	第19-22页
·聚类分析的概念	第20页
·聚类分析算法	第20-22页
·流数据聚类分析	第22-26页
·流数据聚类分析的要求	第22-23页
·流数据聚类分析算法	第23-26页
·本章小结	第26-27页
第3章 Spark计算平台	第27-38页
·云计算概述	第27-29页
·云计算的概念	第27页
·云计算的核心技术	第27-28页
·MapReduce编程模型	第28-29页
·Spark分布式计算平台	第29-37页
·Spark框架概述	第30-31页
·弹性分布式数据集(Resilient Distributed dataset,RDD)	第31-33页
·Spark工作机制详解	第33-36页
·Shuffle机制	第36-37页
·本章小结	第37-38页
第4章 RDDGD-Stream算法的设计与实现	第38-56页
·网格和密度	第38-40页
·RDDGD-Stream算法的总体框架	第40-41页
·数据空间的初始划分	第41-43页
·初始划分的基本思路	第41-42页
·初始划分的实现	第42-43页
·基于有效时间的数据淘汰算法	第43-46页
·算法思路	第44-45页
·算法实现	第45-46页
·基于网格数据点数目的重分区算法	第46-47页
·重分区算法的基本思路	第46页
·重分区算法的实现	第46-47页
·DBSCAN算法的优化	第47-55页
·DBSCAN算法分析	第48-50页
·基于网格的DBSCAN算法——GDBSCAN	第50-52页
·GDBSCAN算法的并行化思路	第52-53页
·GDBSCAN算法的并行化实现	第53-55页
·本章小结	第55-56页
第5章实验与实验结果分析	第56-67页
·GDBSCAN算法的实验设计与结果分析	第56-59页
·实验环境与数据准备	第56页
·等分倍数分析	第56-57页
·加速比分析	第57-59页
·RDDGD-Stream算法的实验设计与结果分析	第59-66页
·实验环境与数据准备	第59-63页
·演化性测试	第63-64页
·聚类质量对比测试	第64页
·聚类效率对比测试	第64-66页
·本章小结	第66-67页
第6章总结与展望	第67-69页
·总结	第67-68页
·展望	第68-69页
参考文献	第69-72页
攻读硕士学位期间发表的论文	第72-73页
致谢	第73页