摘要 | 第6-8页 |
ABSTRACT | 第8-10页 |
第一章 绪论 | 第18-26页 |
1.1 研究背景 | 第18-20页 |
1.2 研究面临的挑战 | 第20-22页 |
1.3 主要贡献 | 第22-24页 |
1.4 章节安排 | 第24-26页 |
第二章 问题定义与研究现状 | 第26-44页 |
2.1 问题定义 | 第26-31页 |
2.1.1 社交媒体数据流模型 | 第26-29页 |
2.1.2 时态关键词查询 | 第29-31页 |
2.2 社交媒体上的关键字查询 | 第31-33页 |
2.3 网页归档数据上的时态关键词查询 | 第33-36页 |
2.3.1 布尔语义下的时态关键词查询 | 第33-35页 |
2.3.2 top-k时态关键词查询 | 第35-36页 |
2.4 时间序列数据上的top-k查询 | 第36-38页 |
2.4.1 时间序列的近似 | 第36-37页 |
2.4.2 top-k查询 | 第37-38页 |
2.5 空间索引 | 第38-40页 |
2.5.1 区间数据索引 | 第38页 |
2.5.2 社交媒体数据上的时空查询 | 第38-39页 |
2.5.3 八叉树结构 | 第39-40页 |
2.6 基于社交媒体中时间序列数据的分析应用 | 第40-41页 |
2.7 本章小结 | 第41-44页 |
第三章 基于社交媒体数据特点的双层倒排索引 | 第44-64页 |
3.1 引言 | 第44-46页 |
3.2 与关键词查询的查询处理 | 第46-51页 |
3.2.1 查询处理框架 | 第46页 |
3.2.2 近似段数据管理 | 第46-47页 |
3.2.3 查询算法 | 第47-49页 |
3.2.4 基于长尾分布的算法复杂度分析 | 第49-51页 |
3.3 双层倒排索引结构 | 第51-55页 |
3.3.1 社交对象的分区 | 第51页 |
3.3.2 第一层倒排列表结构 | 第51-53页 |
3.3.3 第二层倒排索引结构 | 第53页 |
3.3.4 双层倒排列表中的访问 | 第53-55页 |
3.4 分段最大近似摘要 | 第55-56页 |
3.5 实验分析 | 第56-63页 |
3.5.1 实验设置 | 第56-59页 |
3.5.2 不同k值下的查询性能 | 第59-61页 |
3.5.3 不同查询时间窗口宽度下的性能 | 第61-62页 |
3.5.4 不同查询窗口偏移下的性能 | 第62-63页 |
3.6 本章小结 | 第63-64页 |
第四章 社交媒体数据的实时时态关键词查询 | 第64-90页 |
4.1 引言 | 第64页 |
4.2 时态阈值算法 | 第64-69页 |
4.2.1 时态倒排索引 | 第65-66页 |
4.2.2 时态阈值算法 | 第66-69页 |
4.3 日志结构八叉树索引 | 第69-75页 |
4.3.1 日志结构索引 | 第69-70页 |
4.3.2 内存八叉树结构 | 第70-72页 |
4.3.3 磁盘八叉树结构 | 第72-74页 |
4.3.4 磁盘八叉树的合并 | 第74-75页 |
4.4 索引遍历算法 | 第75-82页 |
4.4.1 索引跳转函数 | 第76-77页 |
4.4.2 符合查询条件的节点编码的枚举算法 | 第77-81页 |
4.4.3 并发控制 | 第81-82页 |
4.5 实验分析 | 第82-89页 |
4.5.1 实验设置 | 第82页 |
4.5.2 索引段大小阈值τ的影响 | 第82-84页 |
4.5.3 不同查询设置下的实验结果 | 第84-86页 |
4.5.4 可扩展性实验 | 第86-87页 |
4.5.5 索引的并发访问性能 | 第87-89页 |
4.6 本章小结 | 第89-90页 |
第五章 基于时态关键词查询的微博走势分析 | 第90-110页 |
5.1 引言 | 第90-91页 |
5.2 数据集介绍 | 第91-92页 |
5.3 信息传播度量 | 第92-94页 |
5.3.1 单条微博流行度度量建模 | 第92-93页 |
5.3.2 微博集合的流行度分布建模 | 第93-94页 |
5.4 信息传播度量值的拟合与预测 | 第94-98页 |
5.4.1 方差分析 | 第95-96页 |
5.4.2 趋势建模与预测 | 第96-98页 |
5.5 特征定义及其趋势 | 第98-104页 |
5.5.1 特征抽取 | 第98-99页 |
5.5.2 时序数据的生成 | 第99-101页 |
5.5.3 特征趋势分析 | 第101-104页 |
5.6 特征与信息传播度量间关联 | 第104-108页 |
5.6.1 时序分析技术 | 第104-105页 |
5.6.2 内部特征与信息度量之间的关系 | 第105-106页 |
5.6.3 特征间关系 | 第106-108页 |
5.7 本章小结 | 第108-110页 |
第六章 MicroblogExplorer演示系统 | 第110-120页 |
6.1 系统架构 | 第110-111页 |
6.2 数据获取与分析 | 第111-115页 |
6.2.1 微博获取 | 第112-113页 |
6.2.2 转发爬取 | 第113-114页 |
6.2.3 数据处理与分析 | 第114-115页 |
6.3 查询结果聚类 | 第115-116页 |
6.4 原型系统演示 | 第116-119页 |
6.4.1 时态关键词查询 | 第116-117页 |
6.4.2 查询结果分析 | 第117-119页 |
6.5 本章小结 | 第119-120页 |
第七章 总结与展望 | 第120-124页 |
7.1 本文工作总结 | 第120-121页 |
7.2 未来工作展望 | 第121-124页 |
参考文献 | 第124-132页 |
致谢 | 第132-134页 |
攻读博士学位期间发表论文和科研情况 | 第134-135页 |