面向异构数据中心的新型硬件架构与调度算法

摘要	第3-5页
ABSTRACT	第5-6页
第一章引言	第16-26页
1.1 数据中心架构	第17-20页
1.1.1 传统数据中心中的CPU架构	第17-18页
1.1.2 异构数据中心中的GPU架构	第18-20页
1.2 数据中心应用	第20-22页
1.2.1 传统应用	第21页
1.2.2 新型多线程应用	第21页
1.2.3 异构应用	第21-22页
1.3 研究框架概述	第22-26页
第二章同时多任务GPU：细粒度多任务高吞吐处理器	第26-52页
2.1 研究背景	第26-28页
2.2 相关工作	第28-29页
2.3 研究动机	第29-32页
2.3.1 共享的粒度	第30-31页
2.3.2 Kernel异构性	第31-32页
2.4 同时多任务GPU	第32-42页
2.4.1 部分上下文切换	第32-33页
2.4.2 资源使用率	第33-35页
2.4.3 公平资源分配	第35-39页
2.4.4 通过warp调度算法实现的公平动态资源分配	第39-41页
2.4.5 增加并发kernel的数量	第41-42页
2.5 实验验证	第42-50页
2.5.1 实验方法	第42-43页
2.5.2 SMK设计的结果	第43-44页
2.5.3 与空间划分方法的比较	第44-47页
2.5.4 阻塞时钟周期	第47页
2.5.5 抢占开销	第47-49页
2.5.6 3个或4个kernel	第49页
2.5.7 硬件开销	第49-50页
2.6 本章小结	第50-52页
第三章细粒度共享GPU的QoS支持	第52-76页
3.1 研究背景	第52-53页
3.2 相关工作	第53-55页
3.3 研究动机	第55-56页
3.4 细粒度共享的QoS设计	第56-65页
3.4.1 需要管理的资源	第56-57页
3.4.2 从QoS目标到体系结构指标	第57-58页
3.4.3 体系架构概览	第58-60页
3.4.4 QoS算法	第60-63页
3.4.5 管理Non-QoS Kernel	第63-64页
3.4.6 静态资源分配和调整	第64-65页
3.5 实验验证	第65-74页
3.5.1 实验方法	第65-66页
3.5.2 QoSreach的比较	第66-70页
3.5.3 Non-QoS Kernel的吞吐率	第70页
3.5.4 QoS Kernel的吞吐率	第70-72页
3.5.5 基于优先级的QoS	第72页
3.5.6 SM数量的可扩展性	第72-73页
3.5.7 能效	第73页
3.5.8 抢占开销和其他结果	第73-74页
3.5.9 硬件开销	第74页
3.6 本章小结	第74-76页
第四章基于渐近分析的CPU+GPU协同调度算法	第76-90页
4.1 研究背景	第76-77页
4.2 相关工作	第77-78页
4.3 研究动机	第78-81页
4.3.1 当前调度算法介绍与分析	第79-81页
4.4 基于渐近分析的协同调度算法	第81-84页
4.4.1 CAP的设计	第81-83页
4.4.2 与其他调度算法的比较	第83-84页
4.5 具体实现	第84页
4.6 实验验证	第84-88页
4.7 本章小结	第88-90页
第五章 EMU: QoS感知的弹性资源竞争管理机制	第90-114页
5.1 研究背景	第90-92页
5.2 相关工作	第92-93页
5.3 研究动机	第93-96页
5.3.1 真实系统配置	第93页
5.3.2 OS调度的长尾延迟	第93-95页
5.3.3 现有技术的低硬件利用率	第95-96页
5.3.4 EMU设计指导方针	第96页
5.4 EMU的设计	第96-105页
5.4.1 性能预测器	第97-100页
5.4.2 运行前资源分配器	第100-102页
5.4.3 运行时资源分配器	第102-105页
5.5 实验验证	第105-112页
5.5.1 实验方法	第105-106页
5.5.2 EMU的性能	第106-107页
5.5.3 运行时机制的效果	第107-108页
5.5.4 动态缓存分配的效果	第108页
5.5.5 调整间隔敏感性	第108-109页
5.5.6 建模算法的敏感性	第109-110页
5.5.7 应用到仓库级数据中心	第110-112页
5.6 本章小结	第112-114页
第六章总结和展望	第114-116页
6.1 主要结论	第114-115页
6.2 研究展望	第115-116页
参考文献	第116-132页
致谢	第132-134页
攻读学位期间发表的学术论文	第134-136页
攻读学位期间参与的项目	第136-138页