基于MapReduce化的数据聚类算法的研究、设计与应用
摘要 | 第1-6页 |
Abstract | 第6-9页 |
第1章 绪论 | 第9-15页 |
·数据挖掘 | 第9-10页 |
·云计算 | 第10-13页 |
·研究内容及目的 | 第13-15页 |
第2章 数据挖掘聚类算法 | 第15-26页 |
·准则函数 | 第15-16页 |
·主要聚类算法 | 第16-25页 |
·划分聚类 | 第17-19页 |
·层次聚类 | 第19-20页 |
·基于密度和网格聚类方法 | 第20页 |
·基于模型聚类方法 | 第20-22页 |
·其他聚类方法 | 第22-23页 |
·大规模数据聚类方法 | 第23-25页 |
·本章小结 | 第25-26页 |
第3章 Map-Reduce | 第26-37页 |
·概述 | 第26页 |
·编程思想 | 第26-28页 |
·Hadoop | 第28-30页 |
·关键机制 | 第30-32页 |
·容错处理机制 | 第30-31页 |
·跳过坏数据 | 第31页 |
·推测式执行 | 第31-32页 |
·任务调度 | 第32页 |
·任务本地化 | 第32页 |
·HDFS | 第32-35页 |
·HDFS结构 | 第32-33页 |
·并行复制 | 第33-34页 |
·容错 | 第34-35页 |
·数据流 | 第35页 |
·本章小结 | 第35-37页 |
第4章 聚类算法的MapReduce化 | 第37-63页 |
·k-means | 第37-40页 |
·k-means | 第37-38页 |
·k-means++ | 第38-40页 |
·DBScan | 第40-46页 |
·原始算法 | 第40页 |
·基于MapReduce的DBScan | 第40-46页 |
·近邻传播算法 | 第46-53页 |
·原始算法 | 第46-49页 |
·基于MapReduce的近邻传播算法 | 第49-53页 |
·谱聚类算法 | 第53-61页 |
·原始算法 | 第53-55页 |
·基于MapReduce的谱聚类算法 | 第55-61页 |
·本章小结 | 第61-63页 |
第5章 实验总结 | 第63-69页 |
·时间复杂度 | 第63-65页 |
·聚类结果分析 | 第65-68页 |
·本章小结 | 第68-69页 |
第6章 结论与展望 | 第69-72页 |
·总结 | 第69-70页 |
·展望 | 第70-72页 |
参考文献 | 第72-76页 |
致谢 | 第76页 |