基于MapReduce化的数据聚类算法的研究、设计与应用
| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第1章 绪论 | 第9-15页 |
| ·数据挖掘 | 第9-10页 |
| ·云计算 | 第10-13页 |
| ·研究内容及目的 | 第13-15页 |
| 第2章 数据挖掘聚类算法 | 第15-26页 |
| ·准则函数 | 第15-16页 |
| ·主要聚类算法 | 第16-25页 |
| ·划分聚类 | 第17-19页 |
| ·层次聚类 | 第19-20页 |
| ·基于密度和网格聚类方法 | 第20页 |
| ·基于模型聚类方法 | 第20-22页 |
| ·其他聚类方法 | 第22-23页 |
| ·大规模数据聚类方法 | 第23-25页 |
| ·本章小结 | 第25-26页 |
| 第3章 Map-Reduce | 第26-37页 |
| ·概述 | 第26页 |
| ·编程思想 | 第26-28页 |
| ·Hadoop | 第28-30页 |
| ·关键机制 | 第30-32页 |
| ·容错处理机制 | 第30-31页 |
| ·跳过坏数据 | 第31页 |
| ·推测式执行 | 第31-32页 |
| ·任务调度 | 第32页 |
| ·任务本地化 | 第32页 |
| ·HDFS | 第32-35页 |
| ·HDFS结构 | 第32-33页 |
| ·并行复制 | 第33-34页 |
| ·容错 | 第34-35页 |
| ·数据流 | 第35页 |
| ·本章小结 | 第35-37页 |
| 第4章 聚类算法的MapReduce化 | 第37-63页 |
| ·k-means | 第37-40页 |
| ·k-means | 第37-38页 |
| ·k-means++ | 第38-40页 |
| ·DBScan | 第40-46页 |
| ·原始算法 | 第40页 |
| ·基于MapReduce的DBScan | 第40-46页 |
| ·近邻传播算法 | 第46-53页 |
| ·原始算法 | 第46-49页 |
| ·基于MapReduce的近邻传播算法 | 第49-53页 |
| ·谱聚类算法 | 第53-61页 |
| ·原始算法 | 第53-55页 |
| ·基于MapReduce的谱聚类算法 | 第55-61页 |
| ·本章小结 | 第61-63页 |
| 第5章 实验总结 | 第63-69页 |
| ·时间复杂度 | 第63-65页 |
| ·聚类结果分析 | 第65-68页 |
| ·本章小结 | 第68-69页 |
| 第6章 结论与展望 | 第69-72页 |
| ·总结 | 第69-70页 |
| ·展望 | 第70-72页 |
| 参考文献 | 第72-76页 |
| 致谢 | 第76页 |