首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于弹性分布式数据集的流数据聚类分析

摘要第1-7页
ABSTRACT第7-12页
第1章 绪论第12-16页
   ·研究背景第12页
   ·流数据挖掘的研究现状第12-14页
     ·研究成果第12-13页
     ·存在的问题第13-14页
   ·本文的主要研究内容第14-15页
   ·本文结构第15-16页
第2章 聚类分析概述第16-27页
   ·数据挖掘技术第16-18页
     ·数据挖掘的概念第16页
     ·数据挖掘的过程第16-18页
   ·流数据挖掘第18-19页
     ·流数据的定义及特点第18页
     ·流数据挖掘的特点第18-19页
   ·一般聚类分析概述第19-22页
     ·聚类分析的概念第20页
     ·聚类分析算法第20-22页
   ·流数据聚类分析第22-26页
     ·流数据聚类分析的要求第22-23页
     ·流数据聚类分析算法第23-26页
   ·本章小结第26-27页
第3章 Spark计算平台第27-38页
   ·云计算概述第27-29页
     ·云计算的概念第27页
     ·云计算的核心技术第27-28页
     ·MapReduce编程模型第28-29页
   ·Spark分布式计算平台第29-37页
     ·Spark框架概述第30-31页
     ·弹性分布式数据集(Resilient Distributed dataset,RDD)第31-33页
     ·Spark工作机制详解第33-36页
     ·Shuffle机制第36-37页
   ·本章小结第37-38页
第4章 RDDGD-Stream算法的设计与实现第38-56页
   ·网格和密度第38-40页
   ·RDDGD-Stream算法的总体框架第40-41页
   ·数据空间的初始划分第41-43页
     ·初始划分的基本思路第41-42页
     ·初始划分的实现第42-43页
   ·基于有效时间的数据淘汰算法第43-46页
     ·算法思路第44-45页
     ·算法实现第45-46页
   ·基于网格数据点数目的重分区算法第46-47页
     ·重分区算法的基本思路第46页
     ·重分区算法的实现第46-47页
   ·DBSCAN算法的优化第47-55页
     ·DBSCAN算法分析第48-50页
     ·基于网格的DBSCAN算法——GDBSCAN第50-52页
     ·GDBSCAN算法的并行化思路第52-53页
     ·GDBSCAN算法的并行化实现第53-55页
   ·本章小结第55-56页
第5章 实验与实验结果分析第56-67页
   ·GDBSCAN算法的实验设计与结果分析第56-59页
     ·实验环境与数据准备第56页
     ·等分倍数分析第56-57页
     ·加速比分析第57-59页
   ·RDDGD-Stream算法的实验设计与结果分析第59-66页
     ·实验环境与数据准备第59-63页
     ·演化性测试第63-64页
     ·聚类质量对比测试第64页
     ·聚类效率对比测试第64-66页
   ·本章小结第66-67页
第6章 总结与展望第67-69页
   ·总结第67-68页
   ·展望第68-69页
参考文献第69-72页
攻读硕士学位期间发表的论文第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:基于列存储机制下多维数据仓库模型的优化与研究
下一篇:面向图像分割的空间信息约束的模糊聚类算法研究