基于Hadoop的并行谱聚类算法实现

摘要	第1-6页
Abstract	第6-9页
第一章绪论	第9-13页
·研究背景	第9-10页
·国内外研究现状	第10-11页
·本文的工作	第11-12页
·本文的结构	第12页
·本章小结	第12-13页
第二章 Hadoop平台简述	第13-25页
·Hadoop 简介	第13页
·分布式文件系统 HDFS	第13-19页
·设计前提与目标	第13-14页
·数据块	第14页
·NameNode 和 DataNode	第14-16页
·HDFS 可靠性措施	第16-19页
·并行计算编程思想 MapReduce	第19-22页
·MapReduce 编程模型	第19-20页
·MapReduce 的集群行为	第20-22页
·分布式数据库 HBase	第22-24页
·本章小结	第24-25页
第三章谱聚类算法综述	第25-32页
·概述	第25页
·谱聚类理论基础	第25-30页
·图的基本概念	第25-27页
·图的拉普拉斯矩阵及其性质	第27-28页
·谱聚类算法的实现	第28-30页
·图划分准则	第30-31页
·最小切(Min-cut)准则	第30页
·率切(Ratio-cut)准则	第30-31页
·平均(Average-cut)切准则	第31页
·最小最大切(Min-max-cut)准则	第31页
·本章小结	第31-32页
第四章并行谱聚类算法的实现	第32-44页
·并行谱聚类概述	第32-33页
·单机谱聚类算法分析	第33-34页
·并行谱聚类在 Hadoop 上面的实现	第34-42页
·并行化计算相似矩阵	第35-36页
·并行化计算 k 个最小特征向量	第36-38页
·并行化 K-means 聚类	第38-42页
·算法复杂度的分析	第42-43页
·本章小结	第43-44页
第五章并行谱聚类算法的实验	第44-58页
·实验环境的搭建	第44-52页
·完全分布式搭建 Hadoop	第44-50页
·搭建分布式数据库 HBase	第50-52页
·实验过程及其结果	第52-57页
·实验数据	第52页
·实验分析	第52-56页
·与单机对比	第56-57页
·实验总结	第57页
·本章小结	第57-58页
总结与展望	第58-59页
参考文献	第59-62页
攻读硕士学位期间取得的研究成果	第62-63页
致谢	第63-64页
附件	第64页