摘要 | 第1-4页 |
Abstract | 第4-5页 |
目录 | 第5-8页 |
第一章 绪论 | 第8-13页 |
·研究背景和意义 | 第8-9页 |
·国内外研究现状 | 第9-11页 |
·本文研究内容 | 第11-12页 |
·本文章节安排 | 第12-13页 |
第二章 数据挖掘及聚类分析 | 第13-21页 |
·数据挖掘概述 | 第13页 |
·数据挖掘功能 | 第13-15页 |
·数据特征化与数据区分 | 第13页 |
·挖掘频繁模式、关联和相关性 | 第13-14页 |
·用于预测分析的分类与回归 | 第14页 |
·聚类分析 | 第14-15页 |
·聚类分析概述 | 第15-18页 |
·聚类分析中的数据结构 | 第15-18页 |
·基本聚类方法 | 第18-20页 |
·本章小结 | 第20-21页 |
第三章 基于粒子群的聚类中心获取方法 | 第21-30页 |
·粒子群优化算法 | 第21-23页 |
·粒子群优化算法思想的起源 | 第21页 |
·算法原理 | 第21-22页 |
·粒子群算法的处理流程 | 第22-23页 |
·算法特点 | 第23页 |
·K-means 算法 | 第23-26页 |
·K-means 算法的基本思想和框架 | 第23-24页 |
·K-means 算法的初始值依赖性分析 | 第24-25页 |
·K-means 算法初值选取的现有方法 | 第25-26页 |
·基于粒子群算法的聚类中心获取方法 | 第26-27页 |
·算法基本流程 | 第26-27页 |
·编码方式与适应度选择 | 第27页 |
·实验结果及分析 | 第27-29页 |
·本章小结 | 第29-30页 |
第四章 并行计算 MapReduce 的理论研究 | 第30-35页 |
·Hadoop 技术介绍 | 第30页 |
·Hadoop 基本架构 | 第30-32页 |
·HDFS | 第30-31页 |
·Hadoop Map/Reduce | 第31-32页 |
·MapReduce 编程模型 | 第32-34页 |
·本章小结 | 第34-35页 |
第五章 基于粒子群数据划分、MapReduce 并行处理的 DBSCAN 算法(DPDPSO) | 第35-52页 |
·DBSCAN 算法 | 第35-36页 |
·算法思想 | 第35页 |
·算法框架 | 第35-36页 |
·DBSCAN 算法局限性分析 | 第36-40页 |
·DBSCAN 算法现有的一些改进 | 第40-41页 |
·利用粒子群数据划分、MapReduce 并行处理的 DBSCAN 算法(DPDPSO) | 第41-46页 |
·DPDPSO 算法的构造出发点 | 第41页 |
·DPDPSO 算法的基本思想 | 第41页 |
·数据集的划分 | 第41-42页 |
·利用 k-dist 图确定各个分区的初始参数ε和 MinPts | 第42-43页 |
·利用 MapReduce 并行处理局部数据集 | 第43页 |
·对每个分区的聚类结果进行合并 | 第43-45页 |
·DPDPSO 的算法步骤 | 第45-46页 |
·实验结果 | 第46-51页 |
·实验环境 | 第46-47页 |
·处理分布不均匀数据集对比 | 第47-50页 |
·内存性能对比 | 第50-51页 |
·本章小结 | 第51-52页 |
第六章 主要结论与展望 | 第52-53页 |
·主要结论 | 第52页 |
·展望 | 第52-53页 |
致谢 | 第53-54页 |
参考文献 | 第54-57页 |
附录:作者在攻读硕士学位期间发表的论文 | 第57页 |