摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第13-26页 |
1.1 研究背景 | 第13-15页 |
1.1.1 社交网络发展状况 | 第13-14页 |
1.1.2 社交网络研究 | 第14-15页 |
1.2 研究现状和存在的问题 | 第15-22页 |
1.2.1 传统新事件检测 | 第15-19页 |
1.2.2 社交网络新事件检测 | 第19-21页 |
1.2.3 社交网络新事件检测的特殊性 | 第21-22页 |
1.2.4 社交网络新事件检测存在的问题 | 第22页 |
1.3 研究内容及意义 | 第22-24页 |
1.3.1 研究内容 | 第22-23页 |
1.3.2 主要研究贡献 | 第23-24页 |
1.4 本文的组织 | 第24-26页 |
第2章 社交网络事件检测框架 | 第26-37页 |
2.1 事件检测基本框架 | 第26-28页 |
2.1.1 用户获取 | 第26页 |
2.1.2 微博获取 | 第26-27页 |
2.1.3 新事件检测模块 | 第27-28页 |
2.2 相关基础技术 | 第28-31页 |
2.2.1 中文切词技术 | 第28-29页 |
2.2.2 关键词抽取技术 | 第29-30页 |
2.2.3 向量空间模型 | 第30页 |
2.2.4 文本相似度计算 | 第30-31页 |
2.2.5 基本NED方法 | 第31页 |
2.3 社交网络特性分析 | 第31-34页 |
2.3.1 话题的生命周期 | 第31-32页 |
2.3.2 僵尸用户现象 | 第32-33页 |
2.3.3 话题的单一性 | 第33页 |
2.3.4 社会传染特性 | 第33-34页 |
2.4 改进的在线话题识别框架 | 第34-36页 |
2.4.1 数据爬取处理模块 | 第34页 |
2.4.2 不可信用户筛除 | 第34-35页 |
2.4.3 主题社区划分 | 第35页 |
2.4.4 改进的话题识别生成模块 | 第35-36页 |
2.5 本章小结 | 第36-37页 |
第3章 微博数据采集与存储 | 第37-56页 |
3.1 概述 | 第37页 |
3.2 基于微博API的数据采集方案 | 第37-41页 |
3.2.1 应用创建流程与OAuth2.0授权 | 第37-38页 |
3.2.2 微博API数据采集实现 | 第38-41页 |
3.2.3 基于微博API采集微博数据优缺点 | 第41页 |
3.3 模拟浏览器的微博数据采集方案 | 第41-52页 |
3.3.1 网页数据分析工具(HttpWatch) | 第41-44页 |
3.3.2 微博模拟登录 | 第44-46页 |
3.3.3 微博数据抓取 | 第46-50页 |
3.3.4 微博数据解析 | 第50-51页 |
3.3.5 微博数据存储 | 第51页 |
3.3.6 基于模拟浏览器行为爬取采集微博数据优缺点 | 第51-52页 |
3.4 数值实验与结果分析 | 第52-55页 |
3.4.1 实验结果 | 第52-55页 |
3.4.2 实验分析 | 第55页 |
3.5 本章小结 | 第55-56页 |
第4章 社交网络中恶意用户筛除 | 第56-68页 |
4.1 社交网络平台中恶意用户识别的研究现状 | 第56-58页 |
4.2 基于半监督学习的恶意用户识别算法 | 第58-64页 |
4.3 恶意用户识别实验效果与评估 | 第64-66页 |
4.3.1 实验环境及实验数据 | 第64-65页 |
4.3.2 基准方法的选择 | 第65页 |
4.3.3 实验结果分析 | 第65-66页 |
4.4 本章小结 | 第66-68页 |
第5章 社交网络中基于主题信息的社区划分算法 | 第68-85页 |
5.1 社会网络中社区的定义 | 第68页 |
5.2 社区划分的研究现状 | 第68-70页 |
5.2.1 基于优化的复杂网络聚类方法 | 第69-70页 |
5.2.2 启发式的复杂网络聚类方法 | 第70页 |
5.3 用户关系链中的主题相似度传播与计算 | 第70-78页 |
5.3.1 用户间主题相似关系强度计算 | 第70-75页 |
5.3.2 用户关系链中的主题相似度计算 | 第75-78页 |
5.4 主题相似度计算算法框架 | 第78页 |
5.5 数据预处理模块 | 第78-79页 |
5.6 用户相似度更新模块 | 第79-80页 |
5.7 社区传播模块 | 第80-81页 |
5.8 算法分析 | 第81页 |
5.9 实验结果 | 第81-84页 |
5.9.1 实验环境及实验数据 | 第81-82页 |
5.9.2 精准度对比 | 第82-83页 |
5.9.3 可扩展性 | 第83-84页 |
5.10 本章小结 | 第84-85页 |
第6章 社交网络在线话题识别 | 第85-114页 |
6.1 权威用户筛选 | 第85-92页 |
6.1.1 领域权威用户概念 | 第85-86页 |
6.1.2 研究现状 | 第86-87页 |
6.1.3 基础权威性人物分析模型 | 第87-92页 |
6.2 基于事件的权威用户筛选 | 第92-101页 |
6.2.1 事件获取 | 第93-94页 |
6.2.2 构建事件转发图 | 第94-95页 |
6.2.3 模型和关系 | 第95-97页 |
6.2.4 筛选和验证 | 第97-98页 |
6.2.5 实验及评估 | 第98-100页 |
6.2.6 EBUAR小结 | 第100-101页 |
6.3 种子微博筛选 | 第101-104页 |
6.3.1 微博置信度模型 | 第101-102页 |
6.3.2 微博传播度 | 第102-104页 |
6.3.3 种子微博 | 第104页 |
6.4 基于支持向量机的事件合并模型 | 第104-108页 |
6.5 NED实验和评估 | 第108-113页 |
6.5.1 评估指标 | 第108-109页 |
6.5.2 平均准确率 | 第109页 |
6.5.3 缺失率vs平均检测时间 | 第109-110页 |
6.5.4 缺失率vs误报率vs平均检测时间 | 第110-111页 |
6.5.5 核心用户筛选对NED的影响 | 第111页 |
6.5.6 微博置信度对NED的影响 | 第111-112页 |
6.5.7 主题社区对NED的影响 | 第112-113页 |
6.6 本章小结 | 第113-114页 |
第7章 总结和展望 | 第114-116页 |
7.1 全文总结 | 第114-115页 |
7.2 展望 | 第115-116页 |
参考文献 | 第116-127页 |
致谢 | 第127-128页 |
附录1 攻读学位期间发表的学术论文 | 第128页 |