社交网络人物搜索的研究
摘要 | 第3-5页 |
abstract | 第5-6页 |
第1章 引言 | 第11-28页 |
1.1 研究背景与选题意义 | 第11-13页 |
1.2 研究现状 | 第13-25页 |
1.2.1 基于社交关系推荐 | 第13-16页 |
1.2.2 基于分组信息的推荐 | 第16-18页 |
1.2.3 事件话题专家发现 | 第18-21页 |
1.2.4 聚类话题专家发现 | 第21-22页 |
1.2.5 学术专家发现 | 第22-24页 |
1.2.6 存在的问题和不足 | 第24-25页 |
1.3 我们的主要工作和创新点 | 第25-28页 |
第2章 社交网络数据的获取 | 第28-43页 |
2.1 引言 | 第28页 |
2.2 深度网络爬虫的不足 | 第28-31页 |
2.3 众包爬虫的需求与原理 | 第31-35页 |
2.3.1 众包爬虫的需求 | 第31-32页 |
2.3.2 众包爬虫的原理 | 第32-35页 |
2.4 众包爬虫的实现 | 第35-41页 |
2.4.1 协议状态机设计 | 第35页 |
2.4.2 用户账号池管理机制 | 第35-37页 |
2.4.3 拟人化的爬虫设计 | 第37-41页 |
2.5 数据分配 | 第41页 |
2.6 本章小结 | 第41-43页 |
第3章 社交网络数据的宏观特点 | 第43-51页 |
3.1 整体情况 | 第43页 |
3.2 关注数分布 | 第43-45页 |
3.3 粉丝数分布 | 第45-48页 |
3.4 微博数分布 | 第48-49页 |
3.5 用户标签数分布 | 第49-50页 |
3.6 本章小结 | 第50-51页 |
第4章 社交网络数据的索引系统 | 第51-82页 |
4.1 引言 | 第51-52页 |
4.2 相关工作 | 第52-56页 |
4.2.1 NoSQL与KV Store | 第52-53页 |
4.2.2 缓存感知机制 | 第53-56页 |
4.3 THUIRDB的简介 | 第56-59页 |
4.4 THUIRDB的实现 | 第59-69页 |
4.4.1 预处理 | 第59-61页 |
4.4.2 存储结构 | 第61-62页 |
4.4.3 搜索结构 | 第62-68页 |
4.4.4 时间和空间复杂度分析 | 第68-69页 |
4.5 实验与评价 | 第69-79页 |
4.5.1 实验准备 | 第69-71页 |
4.5.2 实验和评价方法 | 第71-77页 |
4.5.3 讨论 | 第77-79页 |
4.6 本章小结 | 第79-82页 |
第5章 社交网络用户的标签扩展 | 第82-103页 |
5.1 引言 | 第82-83页 |
5.2 相关工作 | 第83-84页 |
5.3 问题定义和调研 | 第84-88页 |
5.4 我们的方法 | 第88-91页 |
5.5 实验 | 第91-99页 |
5.5.1 数据集和工具 | 第91页 |
5.5.2 研究问题 | 第91页 |
5.5.3 训练过程 | 第91-92页 |
5.5.4 基线方法 | 第92页 |
5.5.5 评价和分析 | 第92-99页 |
5.6 讨论 | 第99-102页 |
5.7 本章小结 | 第102-103页 |
第6章 社交网络用户的标签预测 | 第103-119页 |
6.1 概述 | 第103-104页 |
6.2 逻辑回归方法的回顾 | 第104-106页 |
6.3 两阶段标签预测 | 第106-111页 |
6.3.1 亲密好友预测 | 第106-110页 |
6.3.2 标签预测 | 第110-111页 |
6.4 实验 | 第111-118页 |
6.4.1 实验准备 | 第111-112页 |
6.4.2 实验结果 | 第112-118页 |
6.5 本章小结 | 第118-119页 |
第7章 社交网络上的人物排序 | 第119-135页 |
7.1 引言 | 第119-120页 |
7.2 问题定义 | 第120-121页 |
7.3 排序 | 第121-124页 |
7.3.1 标准PageRank算法的问题 | 第122-123页 |
7.3.2 PageRank算法的改进 | 第123-124页 |
7.4 实验 | 第124-134页 |
7.4.1 实验数据 | 第124-125页 |
7.4.2 实验评价 | 第125-134页 |
7.5 本章小结 | 第134-135页 |
第8章 社交网络隐藏专家的挖掘 | 第135-158页 |
8.1 引言 | 第135-140页 |
8.2 假设检验 | 第140-145页 |
8.2.1 问题1-专家之间的关注 | 第142-144页 |
8.2.2 问题2-专家之间的互动 | 第144页 |
8.2.3 问题3-专家和兴趣用户的关系 | 第144-145页 |
8.3 寻找隐藏专家 | 第145-148页 |
8.3.1 伪标注训练语料 | 第146页 |
8.3.2 神经网络 | 第146-148页 |
8.4 实验 | 第148-155页 |
8.4.1 实验的主要目的 | 第148页 |
8.4.2 实验设置 | 第148-149页 |
8.4.3 实验评价 | 第149-155页 |
8.5 样例分析 | 第155-157页 |
8.5.1 极端的例子 | 第155-156页 |
8.5.2 不好的样例 | 第156页 |
8.5.3 正面的样例 | 第156-157页 |
8.6 本章小结 | 第157-158页 |
第9章 总结与展望 | 第158-161页 |
参考文献 | 第161-167页 |
致谢 | 第167-168页 |
个人简历、在学期间发表的学术论文与研究成果 | 第168-169页 |