摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第7-10页 |
1.1 概述 | 第7-9页 |
1.2 本文组织结构 | 第9-10页 |
第二章 社交网络数据抓取研究 | 第10-19页 |
2.1 网络爬虫 | 第10-12页 |
2.1.1 搜索引擎和网络爬虫 | 第10-11页 |
2.1.2 抓取策略 | 第11-12页 |
2.2 站点数据抓取 | 第12-19页 |
2.2.1 传统数据抓取思路 | 第12-15页 |
2.2.2 社交网络数据抓取 | 第15-19页 |
第三章 社交网络数据抓取系统SocialFetcher | 第19-36页 |
3.1 系统体系架构 | 第19-21页 |
3.2 抓取子系统 | 第21-33页 |
3.2.1 基础操作层 | 第22-23页 |
3.2.2 通用封装层 | 第23-29页 |
3.2.3 应用封装层 | 第29-33页 |
3.3 存储子系统 | 第33-36页 |
3.3.1 关系存储 | 第34-35页 |
3.3.2 内容存储 | 第35-36页 |
第四章 社团发现的研究 | 第36-48页 |
4.1 非重叠社团发现 | 第36-38页 |
4.2 基于局部中心节点的距离向量聚类的非重叠社团发现 | 第38-48页 |
4.2.1 局部中心节点 | 第38-40页 |
4.2.2 基本思路 | 第40-41页 |
4.2.3 算法框架 | 第41-43页 |
4.2.4 算法优势 | 第43-48页 |
第五章 微博抓取及社团发现实验 | 第48-57页 |
5.1 框架实现及应用 | 第48-51页 |
5.2 多站点抓取实验 | 第51-55页 |
5.3 微博上的社团发现实验 | 第55-57页 |
第六章 总结与展望 | 第57-58页 |
参考文献 | 第58-60页 |
致谢 | 第60-61页 |