Hadoop环境下CLIQUE算法的改进与并行化研究

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第10-16页
1.1 研究背景与意义	第10-11页
1.2 国内外研究现状	第11-14页
1.3 本文的研究内容	第14-15页
1.4 本文的组织结构	第15-16页
第二章聚类分析算法概述	第16-21页
2.1 聚类的定义	第16页
2.2 经典聚类算法	第16-19页
2.2.1 基于划分的方法	第16-17页
2.2.2 基于层次的方法	第17-18页
2.2.3 基于密度的方法	第18页
2.2.4 基于网格的方法	第18-19页
2.2.5 基于模型的方法	第19页
2.3 聚类分析算法的改进方向	第19-20页
2.4 本章小结	第20-21页
第三章 CLIQUE算法的改进研究	第21-36页
3.1 CLIQUE算法	第21-24页
3.1.1 CLIQUE算法的特点	第21-22页
3.1.2 CLIQUE算法的主要步骤	第22-24页
3.2 改进算法的提出	第24-30页
3.2.1 边界修正方法	第25-26页
3.2.2 滑动网格方法	第26-29页
3.2.3 改进算法中用到的数据结构	第29页
3.2.4 算法描述	第29-30页
3.2.5 改进算法的参数设置	第30页
3.3 改进算法的性能与局限性分析	第30-31页
3.4 实验与结果分析	第31-35页
3.4.1 实验环境	第31页
3.4.2 实验数据	第31-32页
3.4.3 实验结果分析	第32-35页
3.5 本章小结	第35-36页
第四章基于Hadoop的改进CLIQUE算法的并行化	第36-52页
4.1 Hadoop分布式计算平台概述	第36-40页
4.1.1 HDFS分布式文件系统	第36-38页
4.1.2 MapReduce并行计算框架	第38-39页
4.1.3 Hadoop性能优势	第39-40页
4.2 改进CLIQUE算法的并行化设计	第40-45页
4.2.1 网格划分的MapReduce并行化实现	第40-43页
4.2.2 聚类部分的MapReduce并行化实现	第43-44页
4.2.3 并行算法的时间复杂度分析	第44-45页
4.3 实验与结果分析	第45-51页
4.3.1 实验环境及数据	第45-46页
4.3.2 MapReduce性能调优	第46-47页
4.3.3 结果分析	第47-51页
4.4 本章小结	第51-52页
第五章结论	第52-54页
5.1 本文工作总结	第52-53页
5.2 进一步研究展望	第53-54页
参考文献	第54-59页
致谢	第59-60页
附录A (攻读硕士期间发表论文及软件著作权目录)	第60-61页
附录B (攻读硕士期间所主持的科研项目)	第61页