| 摘要 | 第5-6页 |
| ABSTRACT | 第6页 |
| 第一章 绪论 | 第7-10页 |
| 1.1 概述 | 第7-9页 |
| 1.2 本文组织结构 | 第9-10页 |
| 第二章 社交网络数据抓取研究 | 第10-19页 |
| 2.1 网络爬虫 | 第10-12页 |
| 2.1.1 搜索引擎和网络爬虫 | 第10-11页 |
| 2.1.2 抓取策略 | 第11-12页 |
| 2.2 站点数据抓取 | 第12-19页 |
| 2.2.1 传统数据抓取思路 | 第12-15页 |
| 2.2.2 社交网络数据抓取 | 第15-19页 |
| 第三章 社交网络数据抓取系统SocialFetcher | 第19-36页 |
| 3.1 系统体系架构 | 第19-21页 |
| 3.2 抓取子系统 | 第21-33页 |
| 3.2.1 基础操作层 | 第22-23页 |
| 3.2.2 通用封装层 | 第23-29页 |
| 3.2.3 应用封装层 | 第29-33页 |
| 3.3 存储子系统 | 第33-36页 |
| 3.3.1 关系存储 | 第34-35页 |
| 3.3.2 内容存储 | 第35-36页 |
| 第四章 社团发现的研究 | 第36-48页 |
| 4.1 非重叠社团发现 | 第36-38页 |
| 4.2 基于局部中心节点的距离向量聚类的非重叠社团发现 | 第38-48页 |
| 4.2.1 局部中心节点 | 第38-40页 |
| 4.2.2 基本思路 | 第40-41页 |
| 4.2.3 算法框架 | 第41-43页 |
| 4.2.4 算法优势 | 第43-48页 |
| 第五章 微博抓取及社团发现实验 | 第48-57页 |
| 5.1 框架实现及应用 | 第48-51页 |
| 5.2 多站点抓取实验 | 第51-55页 |
| 5.3 微博上的社团发现实验 | 第55-57页 |
| 第六章 总结与展望 | 第57-58页 |
| 参考文献 | 第58-60页 |
| 致谢 | 第60-61页 |