基于标签传播的社区发现算法研究及其并行化
摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第7-13页 |
1.1 研究背景和意义 | 第7-8页 |
1.2 国内外相关研究与应用现状 | 第8-11页 |
1.2.1 传统社区发现算法研究现状 | 第8-9页 |
1.2.2 重叠社区发现算法研究现状 | 第9-11页 |
1.3 研究内容 | 第11页 |
1.4 论文内容的组织 | 第11-13页 |
第二章 相关理论基础 | 第13-24页 |
2.1 相关理论 | 第13-15页 |
2.1.1 社交网络与图 | 第13页 |
2.1.2 社交网络中的社区结构 | 第13-14页 |
2.1.3 社交网络中的距离与相似性度量 | 第14-15页 |
2.2 标签传播算法 | 第15-17页 |
2.2.1 标签传播算法 | 第15-16页 |
2.2.2 改进的标签传播算法 | 第16-17页 |
2.3 Spark分布式平台 | 第17-23页 |
2.3.1 Spark简介 | 第17-19页 |
2.3.2 SparkRDD及其设计思想 | 第19-20页 |
2.3.3 GraphX简介 | 第20-23页 |
2.4 本章小结 | 第23-24页 |
第三章 基于概率和相似度的并行标签传播方法 | 第24-41页 |
3.1 K-Shell分解方法 | 第24-25页 |
3.2 基于概率和相似度的标签传播方法 | 第25-30页 |
3.3 基于概率和相似度的并行标签传播方法 | 第30-33页 |
3.3.1 图的构造及邻居信息收集 | 第30-31页 |
3.3.2 结合位置索引和邻居索引计算节点权重 | 第31页 |
3.3.3 节点间的传播概率及相似度计算 | 第31-32页 |
3.3.4 节点标签初始化 | 第32页 |
3.3.5 标签传播和标签选择 | 第32-33页 |
3.4 PSPLPA的效率分析 | 第33页 |
3.5 实验设计以及结果分析 | 第33-40页 |
3.5.1 实验数据集 | 第34-35页 |
3.5.2 评价标准 | 第35-36页 |
3.5.3 结果分析 | 第36-40页 |
3.6 本章小结 | 第40-41页 |
第四章 基于权重和随机游走的并行标签传播方法 | 第41-51页 |
4.1 随机游走的概念和相似度计算方式 | 第41-42页 |
4.2 基于权重和随机游走的标签传播算法 | 第42-44页 |
4.3 基于权重和随机游走的并行标签传播算法 | 第44-45页 |
4.4 时间复杂度分析 | 第45-46页 |
4.5 实验设计以及结果分析 | 第46-50页 |
4.5.1 真实网络数据集 | 第46-47页 |
4.5.2 人造网络数据集 | 第47-50页 |
4.6 本章小结 | 第50-51页 |
第五章 结束语 | 第51-53页 |
5.1 总结 | 第51页 |
5.2 展望 | 第51-53页 |
参考文献 | 第53-57页 |
作者简介 | 第57-58页 |
致谢 | 第58页 |