首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--机房论文

面向异构数据中心的新型硬件架构与调度算法

摘要第3-5页
ABSTRACT第5-6页
第一章 引言第16-26页
    1.1 数据中心架构第17-20页
        1.1.1 传统数据中心中的CPU架构第17-18页
        1.1.2 异构数据中心中的GPU架构第18-20页
    1.2 数据中心应用第20-22页
        1.2.1 传统应用第21页
        1.2.2 新型多线程应用第21页
        1.2.3 异构应用第21-22页
    1.3 研究框架概述第22-26页
第二章 同时多任务GPU:细粒度多任务高吞吐处理器第26-52页
    2.1 研究背景第26-28页
    2.2 相关工作第28-29页
    2.3 研究动机第29-32页
        2.3.1 共享的粒度第30-31页
        2.3.2 Kernel异构性第31-32页
    2.4 同时多任务GPU第32-42页
        2.4.1 部分上下文切换第32-33页
        2.4.2 资源使用率第33-35页
        2.4.3 公平资源分配第35-39页
        2.4.4 通过warp调度算法实现的公平动态资源分配第39-41页
        2.4.5 增加并发kernel的数量第41-42页
    2.5 实验验证第42-50页
        2.5.1 实验方法第42-43页
        2.5.2 SMK设计的结果第43-44页
        2.5.3 与空间划分方法的比较第44-47页
        2.5.4 阻塞时钟周期第47页
        2.5.5 抢占开销第47-49页
        2.5.6 3个或4个kernel第49页
        2.5.7 硬件开销第49-50页
    2.6 本章小结第50-52页
第三章 细粒度共享GPU的QoS支持第52-76页
    3.1 研究背景第52-53页
    3.2 相关工作第53-55页
    3.3 研究动机第55-56页
    3.4 细粒度共享的QoS设计第56-65页
        3.4.1 需要管理的资源第56-57页
        3.4.2 从QoS目标到体系结构指标第57-58页
        3.4.3 体系架构概览第58-60页
        3.4.4 QoS算法第60-63页
        3.4.5 管理Non-QoS Kernel第63-64页
        3.4.6 静态资源分配和调整第64-65页
    3.5 实验验证第65-74页
        3.5.1 实验方法第65-66页
        3.5.2 QoSreach的比较第66-70页
        3.5.3 Non-QoS Kernel的吞吐率第70页
        3.5.4 QoS Kernel的吞吐率第70-72页
        3.5.5 基于优先级的QoS第72页
        3.5.6 SM数量的可扩展性第72-73页
        3.5.7 能效第73页
        3.5.8 抢占开销和其他结果第73-74页
        3.5.9 硬件开销第74页
    3.6 本章小结第74-76页
第四章 基于渐近分析的CPU+GPU协同调度算法第76-90页
    4.1 研究背景第76-77页
    4.2 相关工作第77-78页
    4.3 研究动机第78-81页
        4.3.1 当前调度算法介绍与分析第79-81页
    4.4 基于渐近分析的协同调度算法第81-84页
        4.4.1 CAP的设计第81-83页
        4.4.2 与其他调度算法的比较第83-84页
    4.5 具体实现第84页
    4.6 实验验证第84-88页
    4.7 本章小结第88-90页
第五章 EMU: QoS感知的弹性资源竞争管理机制第90-114页
    5.1 研究背景第90-92页
    5.2 相关工作第92-93页
    5.3 研究动机第93-96页
        5.3.1 真实系统配置第93页
        5.3.2 OS调度的长尾延迟第93-95页
        5.3.3 现有技术的低硬件利用率第95-96页
        5.3.4 EMU设计指导方针第96页
    5.4 EMU的设计第96-105页
        5.4.1 性能预测器第97-100页
        5.4.2 运行前资源分配器第100-102页
        5.4.3 运行时资源分配器第102-105页
    5.5 实验验证第105-112页
        5.5.1 实验方法第105-106页
        5.5.2 EMU的性能第106-107页
        5.5.3 运行时机制的效果第107-108页
        5.5.4 动态缓存分配的效果第108页
        5.5.5 调整间隔敏感性第108-109页
        5.5.6 建模算法的敏感性第109-110页
        5.5.7 应用到仓库级数据中心第110-112页
    5.6 本章小结第112-114页
第六章 总结和展望第114-116页
    6.1 主要结论第114-115页
    6.2 研究展望第115-116页
参考文献第116-132页
致谢第132-134页
攻读学位期间发表的学术论文第134-136页
攻读学位期间参与的项目第136-138页

论文共138页,点击 下载论文
上一篇:多通道脑深部电极记录信号分析与癫痫脑网络研究
下一篇:基于生物图像的蛋白质亚细胞定位及其动态转移检测