| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第一章 绪论 | 第10-20页 |
| ·研究背景与意义 | 第10-11页 |
| ·社区划分问题 | 第10页 |
| ·基于模块度(Modularity)的社区划分算法 | 第10-11页 |
| ·传统方法无法解决的问题 | 第11页 |
| ·隐性语义挖掘国内外发展现状 | 第11-17页 |
| ·主题模型所解决的问题 | 第11-12页 |
| ·LDA 基础模型 | 第12-15页 |
| ·协同响应 LDA 模型(Correspondence LDA) | 第15-17页 |
| ·LDA 用于社区划分的新思路 | 第17-18页 |
| ·本文的结构安排 | 第18-20页 |
| 第二章 社区数据概述和数据的工程采集 | 第20-27页 |
| ·社区数据的选择 | 第20-21页 |
| ·新浪微博简介 | 第20页 |
| ·新浪微博与其他数据平台对比 | 第20-21页 |
| ·数据采集的工程架构 | 第21-24页 |
| ·新浪微博开放平台 | 第21-22页 |
| ·数据抓取技术架构 | 第22-23页 |
| ·Amoeba 读写分离的数据存储结构 | 第23-24页 |
| ·数据特点及规模 | 第24-26页 |
| ·新浪微博社区结构完善 | 第24-25页 |
| ·新浪微博具备社交属性、媒体属性 | 第25页 |
| ·数据规模 | 第25-26页 |
| ·本章小结 | 第26-27页 |
| 第三章 社区特征统计与现有 LDA 分群方法分析 | 第27-44页 |
| ·社区边的多样性 | 第27-34页 |
| ·新浪微博用户结构 | 第27-29页 |
| ·社区边的多样性和普遍特征 | 第29-34页 |
| ·社交网络与兴趣网络的重叠 | 第34-40页 |
| ·不同类别用户行为体现兴趣特征 | 第34-39页 |
| ·社交网络与兴趣网络重叠 | 第39-40页 |
| ·现有 LDA 模型在社区划分中的应用及局限性 | 第40-43页 |
| ·基础 LDA 的社区划分 | 第40-41页 |
| ·主题相关的协同响应 LDA 的应用及其局限性 | 第41-42页 |
| ·主题独立的协同响应 LDA 的应用局限性 | 第42-43页 |
| ·本章小结 | 第43-44页 |
| 第四章 SI-LDA 分群算法 | 第44-61页 |
| ·社交图谱-兴趣图谱 LDA 算法 | 第44-48页 |
| ·描述用户的两个指标 | 第44-45页 |
| ·PageRank 区分用户的社交图谱与兴趣图谱 | 第45页 |
| ·SI-LDA 模型 | 第45-47页 |
| ·SI-LDA 模型的简化模型 | 第47-48页 |
| ·RA 节点亲密度优化社交图谱 | 第48-52页 |
| ·Resource Allocation 描述用户间亲密度 | 第48-49页 |
| ·用 RA 亲密度优化社交图谱 | 第49-52页 |
| ·Gibbs Sampling[29][33]参数推导 | 第52-54页 |
| ·社区划分实验 | 第54页 |
| ·数据准备和参数设定 | 第54页 |
| ·计算 RA 亲密度 | 第54页 |
| ·Gibbs Sampling 做 LDA 训练 | 第54页 |
| ·社交图谱划分与 Louvain 算法对比 | 第54-60页 |
| ·Louvain 算法 | 第54-56页 |
| ·社交网络分群结果 | 第56-59页 |
| ·两种不同结果的分析和讨论 | 第59-60页 |
| ·本章小结 | 第60-61页 |
| 第五章 基于 SI-LDA 的社区检索与命名等应用 | 第61-71页 |
| ·用兴趣标签对 SI-LDA 的社区命名 | 第61-64页 |
| ·兴趣是新浪微博的独特价值 | 第61-62页 |
| ·名人效应与兴趣:排除公知名人 | 第62-63页 |
| ·媒体、营销大号与兴趣:排除营销大号 | 第63页 |
| ·SI-LDA 的社区命名 | 第63-64页 |
| ·SI-LDA 用于社区检索的方法 | 第64-65页 |
| ·新浪微博全局兴趣检索的实验 | 第65-70页 |
| ·数据准备 | 第65页 |
| ·兴趣群的划分 | 第65页 |
| ·各类兴趣的用户数 | 第65-70页 |
| ·本章小结 | 第70-71页 |
| 第六章 结论 | 第71-75页 |
| ·SI-LDA 在实际社区划分中的创新点 | 第71-72页 |
| ·RA-Based LDA 在社交分群的使用优势 | 第71页 |
| ·PageRank-Based LDA 在兴趣分群的使用优势 | 第71-72页 |
| ·社区命名的优势 | 第72页 |
| ·社区检索的优势 | 第72页 |
| ·SI-LDA 在社区划分中的缺陷 | 第72-73页 |
| ·工作展望 | 第73-75页 |
| 致谢 | 第75-76页 |
| 参考文献 | 第76-78页 |
| 攻硕期间取得的研究成果 | 第78-79页 |