一种面向大数据的文本聚类算法
摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-13页 |
·研究背景 | 第9-10页 |
·国内外研究现状及趋势 | 第10-13页 |
2 大数据概念、特点、价值及挑战 | 第13-19页 |
·大数据定义 | 第13页 |
·大数据特点 | 第13-16页 |
·大数据的规模是相对的 | 第14页 |
·大数据的数据结构特点 | 第14-15页 |
·大数据实时响应特点 | 第15页 |
·大数据的其他特点 | 第15-16页 |
·大数据价值 | 第16-17页 |
·大数据挑战 | 第17-19页 |
3 大数据处理平台Hadoop | 第19-28页 |
·HDFS概念和特点 | 第19-20页 |
·Map Reduce原理与设计思想 | 第20-24页 |
·Map Reduce定义 | 第20-21页 |
·Map Reduce设计思想 | 第21-24页 |
·Map Reduce提供的主要功能 | 第24页 |
·Mahout概念,特点与发展 | 第24-26页 |
·Mahout与大数据 | 第26-28页 |
4 聚类算法原理 | 第28-34页 |
·K-Means原理 | 第28页 |
·谱聚类算法原理 | 第28-34页 |
·几种不同的图的构造方法 | 第29-30页 |
·几种图的拉普拉斯矩阵和其基本属性 | 第30-34页 |
5 并行谱聚类算法 | 第34-43页 |
·算法分析 | 第34-36页 |
·并行谱聚类算法相关研究 | 第36-37页 |
·特征分解方法选取 | 第36-37页 |
·K-means选择 | 第37页 |
·本文算法 | 第37-43页 |
·技术性问题 | 第37-38页 |
·算法 | 第38-43页 |
6 Hadoop集群环境搭建与实验 | 第43-50页 |
·Hadoop集群环境搭建 | 第43-48页 |
·实验 | 第48-50页 |
总结 | 第50-52页 |
致谢 | 第52-53页 |
参考文献 | 第53-58页 |
附录1 攻读学位期间发表论文目录 | 第58页 |