在线社交网络的UNI64采样方法研究
学位论文数据集 | 第3-4页 |
摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
目录 | 第8-11页 |
Contents | 第11-14页 |
第一章 绪论 | 第14-24页 |
1.1 课题研究背景及意义 | 第14-16页 |
1.2 国内外相关的研究介绍 | 第16-22页 |
1.2.1 复杂网络理论的发展与现状 | 第16-18页 |
1.2.2 在线社交网络的相关研究 | 第18-19页 |
1.2.3 网络采样方法的相关研究 | 第19-20页 |
1.2.4 在线社交网络在企业中的应用价值 | 第20-22页 |
1.3 论文的主要贡献 | 第22-23页 |
1.4 论文的组织结构 | 第23-24页 |
第二章 在线社交网络采样方法 | 第24-34页 |
2.1 统计学中的基本采样方法 | 第24-27页 |
2.1.1 随机采样方法 | 第25-26页 |
2.1.2 非随机采样方法 | 第26-27页 |
2.2 在线社交网络中常用的采样方法 | 第27-29页 |
2.2.1 广度优先采样方法 | 第27-28页 |
2.2.2 随机游走采样算法 | 第28-29页 |
2.3 UNI方法 | 第29-32页 |
2.3.1 接受—拒绝采样 | 第29-30页 |
2.3.2 UNI方法分析 | 第30-31页 |
2.3.3 UNI64方法初步构想 | 第31-32页 |
2.4 本章小结 | 第32-34页 |
第三章 新浪微博用户ID分布分析 | 第34-42页 |
3.1 新浪微博有效ID样本采集 | 第34-37页 |
3.1.1 网络信息获取方法 | 第34-35页 |
3.1.2 网络爬虫程序设计与实现 | 第35-37页 |
3.2 新浪微博有效ID分布分析 | 第37-41页 |
3.2.1 按ID数值长度统计 | 第37-38页 |
3.2.2 等距区间内ID数量统计 | 第38-41页 |
3.3 本章小结 | 第41-42页 |
第四章 UNI64采样方法设计 | 第42-56页 |
4.1 UNI64方法概述 | 第42-43页 |
4.2 有效ID样本采集 | 第43页 |
4.3 有效区间划分算法 | 第43-52页 |
4.3.1 问题描述 | 第43-45页 |
4.3.2 算法设计 | 第45-52页 |
4.4 有效区间内的随机采样 | 第52-55页 |
4.4.1 区间比例策略 | 第52-53页 |
4.4.2 区间映射策略 | 第53-55页 |
4.5 本章小结 | 第55-56页 |
第五章 UNI64方法实验与分析 | 第56-70页 |
5.1 固定采样次数实验 | 第56-60页 |
5.1.1 采样命中率对比 | 第56-58页 |
5.1.2 采样结果随机性检验 | 第58-60页 |
5.2 固定目标有效ID个数采样实验 | 第60-62页 |
5.2.1 采样命中率对比 | 第60-61页 |
5.2.2 采样结果随机性检验 | 第61-62页 |
5.3 不同原始样本量实验 | 第62-67页 |
5.3.1 元素合并与集合合并比分析 | 第62-64页 |
5.3.2 实际采样命中率分析 | 第64-66页 |
5.3.3 采样结果分布与随机性分析 | 第66-67页 |
5.4 本章小结 | 第67-70页 |
第六章 结论与展望 | 第70-72页 |
6.1 论文主要成果 | 第70-71页 |
6.2 后续工作与展望 | 第71-72页 |
参考文献 | 第72-76页 |
附录1 | 第76-80页 |
致谢 | 第80-82页 |
发表的学术论文 | 第82-84页 |
作者及导师简介 | 第84-86页 |
附件 | 第86-87页 |