基于Spark的社区发现和关键人物挖掘算法的研究与应用

摘要	第4-6页
ABSTRACT	第6-8页
第一章绪论	第12-19页
1.1 研究背景	第12-13页
1.2 研究目的及意义	第13页
1.3 国内外研究现状	第13-17页
1.3.1 分布式计算平台	第13-15页
1.3.2 社区发现研究	第15-16页
1.3.3 关键人物挖掘	第16-17页
1.4 研究内容	第17-18页
1.5 本文组织结构	第18页
1.6 本章小结	第18-19页
第二章相关工作研究	第19-27页
2.1 社区发现和关键人物概述	第19-20页
2.2 社区发现相关算法	第20页
2.2.1 LPA算法	第20页
2.2.2 GN算法	第20页
2.3 关键人物相关算法	第20-21页
2.3.1 PageRank算法	第20-21页
2.3.2 TwitterRank	第21页
2.4 SPARK分布式计算框架	第21-26页
2.4.1 Spark集群架构	第22-23页
2.4.2 YARN资源调度	第23-24页
2.4.3 Spark RDD	第24-25页
2.4.4 Spark GraphX	第25-26页
2.5 本章小结	第26-27页
第三章 PAGERANK关键人物挖掘算法并行化研究	第27-35页
3.1 PAGERANK算法思想	第27页
3.2 微博用户影响力和边权计算模型	第27-29页
3.2.1 微博用户初始影响力计算	第28页
3.2.2 基于链接关系的用户最终影响力计算	第28-29页
3.2.3 微博社交图边权值的计算	第29页
3.3 单机环境下PAGERANK算法实现	第29-30页
3.4 PAGERANK并行化实现	第30-34页
3.4.1 PageRank并行化分析	第30-31页
3.4.2 PageRank并行化的核心步骤	第31-32页
3.4.3 PageRank并行化示例的执行过程及过程分析	第32-34页
3.5 本章小结	第34-35页
第四章 LOUVAIN社区发现算法并行化研究	第35-41页
4.1 LOUVAIN算法思想	第35-36页
4.1.1 模块度增量计算公式	第35页
4.1.2 模块度函数	第35-36页
4.2 单机环境下LOUVIAN算法的实现	第36-37页
4.3 LOUVAIN算法并行化实现	第37-40页
4.3.1 Louvain并行化分析	第37-38页
4.3.2 Louvain并行化的核心步骤	第38-40页
4.4 本章小结	第40-41页
第五章实验设计与分析	第41-51页
5.1 实验环境	第41-42页
5.2 实验数据分析	第42-43页
5.3 数据可视化工具	第43-44页
5.3.1 D3	第44页
5.3.2 Gephi	第44页
5.4 实验结果与分析	第44-50页
5.4.1 PageRank关键人物挖掘并行化前后分析	第44-46页
5.4.2 Louvain社区发现并行化前后分析	第46-47页
5.4.3 有权图对Louvain社区发现结果的影响分析	第47-50页
5.5 本章小结	第50-51页
第六章研究总结与展望	第51-53页
6.1 总结	第51页
6.2 展望	第51-53页
参考文献	第53-57页
在学期间的研究成果	第57-58页
致谢	第58页