基于Spark的文本谱聚类算法并行化研究

摘要	第4-5页
ABSTRACT	第5页
1 绪论	第8-15页
1.1 研究背景及意义	第8-9页
1.2 国内外研究现状	第9-12页
1.3 论文的研究内容	第12-13页
1.4 论文结构安排	第13-15页
2 文本谱聚类算法模型	第15-23页
2.1 谱聚类算法	第15-20页
2.2 文本谱聚类模型	第20-22页
2.3 本章小结	第22-23页
3 文本谱聚类算法并行化设计	第23-28页
3.1 文本聚类算法并行化需求分析	第23-24页
3.2 文本聚类算法并行化设计思想	第24-27页
3.3 本章小结	第27-28页
4 基于Spark的谱聚类算法并行化	第28-37页
4.1 基于内存计算的Spark框架	第28-29页
4.2 基于Spark的并行谱聚类算法分析	第29-30页
4.3 并行化实现谱聚类算法	第30-36页
4.4 本章小结	第36-37页
5 实验结果与分析	第37-47页
5.1 实验环境	第37-38页
5.2 数据集和评价指标	第38-39页
5.3 实验结果及分析	第39-46页
5.4 本章小结	第46-47页
6 总结与展望	第47-49页
6.1 论文总结	第47-48页
6.2 研究展望	第48-49页
致谢	第49-50页
参考文献	第50-54页