摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
第1章 绪论 | 第17-35页 |
1.1 研究背景 | 第17-23页 |
1.1.1 物联网大数据 | 第17-19页 |
1.1.2 物联网数据存储与管理需求 | 第19-23页 |
1.2 国内外相关工作概述 | 第23-27页 |
1.2.1 数据存储 | 第23-24页 |
1.2.2 数据索引 | 第24-26页 |
1.2.3 数据统计分析 | 第26页 |
1.2.4 数据中心能耗优化 | 第26-27页 |
1.3 本文研究内容 | 第27-31页 |
1.4 本文的主要贡献 | 第31-32页 |
1.5 本文的组织框架 | 第32-35页 |
第2章 面向海量小文件的分布式文件系统 | 第35-67页 |
2.1 引言 | 第35-37页 |
2.2 相关工作 | 第37-39页 |
2.2.1 面向海量小文件的磁盘缓存策略 | 第37页 |
2.2.2 面向海量小文件的客户端聚集策略 | 第37页 |
2.2.3 面向海量小文件的集中式DRAM缓存策略 | 第37-38页 |
2.2.4 相关工作总结 | 第38-39页 |
2.3 SensorFS总体设计方案 | 第39-40页 |
2.4 分布式内存文件系统设计 | 第40-47页 |
2.4.1 DMFS系统架构 | 第40-42页 |
2.4.2 DMFS的文件写流程 | 第42-43页 |
2.4.3 DMFS的特性 | 第43-44页 |
2.4.4 SensorFS的可靠性 | 第44-45页 |
2.4.5 SensorFS的有效性分析 | 第45-47页 |
2.5 基于依赖关系的传感器聚类 | 第47-57页 |
2.5.1 总体思路 | 第47-48页 |
2.5.2 依赖关系的定义 | 第48-49页 |
2.5.3 依赖图 | 第49-53页 |
2.5.4 传感器聚类 | 第53-57页 |
2.6 实验与结果分析 | 第57-65页 |
2.6.1 实验设置与数据集 | 第57-58页 |
2.6.2 内存写速率对比 | 第58-59页 |
2.6.3 外存写速率对比 | 第59-61页 |
2.6.4 查询性能 | 第61-64页 |
2.6.5 传感器聚类 | 第64-65页 |
2.7 总结 | 第65-67页 |
第3章 空间有效的高性能键值数据检索系统 | 第67-89页 |
3.1 引言 | 第67-71页 |
3.2 相关工作 | 第71-74页 |
3.2.1 索引更新优化 | 第71-72页 |
3.2.2 索引空间开销优化 | 第72-74页 |
3.3 Radix KV总体设计思路 | 第74-78页 |
3.3.1 系统架构设计 | 第74-76页 |
3.3.2 HashStore | 第76页 |
3.3.3 SortedStore | 第76-78页 |
3.4 IndexedStore | 第78-85页 |
3.4.1 Radix Array的整体设计 | 第78-80页 |
3.4.2 内部节点数组 | 第80-83页 |
3.4.3 内部节点路由数组 | 第83-84页 |
3.4.4 IndexedStore中的索引更新 | 第84-85页 |
3.5 实验 | 第85-88页 |
3.6 总结 | 第88-89页 |
第4章 面向概率数据的聚集查询数据立方体 | 第89-121页 |
4.1 引言 | 第89-92页 |
4.2 相关工作 | 第92-95页 |
4.2.1 可能世界模型 | 第92页 |
4.2.2 基于可能世界模型的OLAP概率查询 | 第92-95页 |
4.3 基于卷积的聚集操作 | 第95-100页 |
4.3.1 预备知识 | 第95-96页 |
4.3.2 Object-Cell关系 | 第96-97页 |
4.3.3 补全型pmf | 第97-98页 |
4.3.4 基于卷积的聚集查询 | 第98-100页 |
4.4 数据立方体的物化操作 | 第100-106页 |
4.4.1 全物化 | 第100-103页 |
4.4.2 部分物化 | 第103页 |
4.4.3 代价估计模型 | 第103-105页 |
4.4.4 拓展到Count聚集操作 | 第105-106页 |
4.5 基于Sketch的聚集操作 | 第106-108页 |
4.6 面向Cuboid的概率查询 | 第108-110页 |
4.6.1 查询定义 | 第108-109页 |
4.6.2 基于Sketch的查询剪枝策略 | 第109-110页 |
4.7 实验 | 第110-119页 |
4.7.1 实验设置 | 第110-111页 |
4.7.2 聚集 | 第111页 |
4.7.3 物化 | 第111-114页 |
4.7.4 概率查询 | 第114-118页 |
4.7.5 Count聚集操作 | 第118-119页 |
4.8 总结 | 第119-121页 |
第5章 基于YARN的流任务节能调度框架 | 第121-149页 |
5.1 引言 | 第121-122页 |
5.2 相关工作 | 第122-125页 |
5.2.1 任务性能模型 | 第122-123页 |
5.2.2 MapReduce任务的能耗有效性调度 | 第123-124页 |
5.2.3 Hadoop集群的能耗有效性 | 第124-125页 |
5.2.4 相关工作总结 | 第125页 |
5.3 Green YARN总体设计方案 | 第125-128页 |
5.4 基于YARN的任务功耗有效性模型 | 第128-133页 |
5.4.1 基于YARN的任务性能建模 | 第128-130页 |
5.4.2 基于YARN的任务功耗建模 | 第130-131页 |
5.4.3 任务的功耗有效性优化 | 第131-133页 |
5.5 批处理任务调度算法 | 第133-139页 |
5.5.1 集群功耗有效性 | 第134-137页 |
5.5.2 批处理任务调度算法 | 第137-139页 |
5.6 在线任务调度 | 第139-140页 |
5.7 实验 | 第140-147页 |
5.7.1 基于YARN的任务功耗有效性模型 | 第141-144页 |
5.7.2 批处理任务调度 | 第144-147页 |
5.7.3 在线任务调度 | 第147页 |
5.8 总结 | 第147-149页 |
第6章 结束语 | 第149-153页 |
6.1 本文的主要工作 | 第149-150页 |
6.2 本文的主要贡献和创新点 | 第150-151页 |
6.3 下一步的研究工作 | 第151-153页 |
参考文献 | 第153-163页 |
致谢 | 第163-165页 |
在读期间发表的学术论文与取得的研究成果 | 第165-166页 |