首页--工业技术论文--无线电电子学、电信技术论文--微电子学、集成电路(IC)论文--一般性问题论文--设计论文

GPU功耗评估和优化技术研究

摘要第5-7页
ABSTRACT第7-9页
符号对照表第14-15页
缩略语对照表第15-21页
第一章 绪论第21-37页
    1.1 研究背景第21-27页
        1.1.1 GPU发展概况第21-22页
        1.1.2 并行计算第22-23页
        1.1.3 GPU发展面临的问题第23-27页
    1.2 相关研究工作第27-32页
        1.2.1 GPU体系结构发展第27-28页
        1.2.2 GPU负载特性和性能研究第28-29页
        1.2.3 GPU功耗建模与估计方面的研究第29-30页
        1.2.4 功耗优化技术研究第30-32页
    1.3 本文的工作和主要创新点第32-34页
        1.3.1 研究目标第32-33页
        1.3.2 研究内容第33-34页
        1.3.3 创新点第34页
    1.4 论文结构第34-37页
第二章 Firefly2硬件体系结构设计第37-65页
    2.1 Firefly2编程模型第37-38页
    2.2 Firefly2架构设计第38-48页
        2.2.1 指令集结构第38-39页
        2.2.2 Firefly2系统结构第39-40页
        2.2.3 簇结构第40-41页
        2.2.4 簇控制器第41页
        2.2.5 行控制器第41-42页
        2.2.6 列控制器第42页
        2.2.7 处理器单元第42-45页
        2.2.8 数据传输第45-47页
        2.2.9 通信机制第47-48页
    2.3 Firefly2上的并行计算第48-53页
        2.3.1 数据级并行计算第48-49页
        2.3.2 线程级并行计算第49页
        2.3.3 操作级并行计算第49-51页
        2.3.4 分布式指令级并行计算第51页
        2.3.5 混合并行处理方式第51-53页
    2.4 在Firefly2上实现3D图形渲染第53-58页
        2.4.1 固定图形渲染管线的实现第53-54页
        2.4.2 统一渲染管线的实现第54-58页
    2.5 在Firefly2上实现计算机视觉第58-62页
    2.6 软件仿真环境第62-63页
    2.7 与相关工作的比较第63-64页
    2.8 本章小结第64-65页
第三章 3D图形渲染管线的能耗建模及性能分析第65-89页
    3.1 3D图形渲染管线第65-67页
        3.1.1 渲染管线第65-66页
        3.1.2 图元第66-67页
    3.2 能耗建模第67-75页
        3.2.1 几何变换第67-68页
        3.2.2 顶点着色第68-70页
        3.2.3 视景体裁剪第70-71页
        3.2.4 背面剔除第71-72页
        3.2.5 扫描转换第72页
        3.2.6 像素着色第72-74页
        3.2.7 段操作第74-75页
    3.3 性能分析第75-83页
        3.3.1 着色器负载分析第75-79页
        3.3.2 存储器带宽分析第79-82页
        3.3.3 能耗估计模型第82-83页
    3.4 模型验证第83-87页
        3.4.1 实验平台和测试用例第83-85页
        3.4.2 结果与分析第85-87页
    3.5 本章小结第87-89页
第四章 Firefly2处理器功耗优化第89-123页
    4.1 功耗组成与分析第89-95页
        4.1.1 动态功耗第89-91页
        4.1.2 静态功耗第91-93页
        4.1.3 功耗分析第93-95页
    4.2 低功耗设计技术第95-103页
        4.2.1 工艺级第95页
        4.2.2 电路级第95页
        4.2.3 逻辑级第95-97页
        4.2.4 RTL级第97-98页
        4.2.5 体系结构级第98-99页
        4.2.6 系统级第99-103页
    4.3 软件功耗优化技术第103-109页
        4.3.1 采用索引三角形列表第103-104页
        4.3.2 顶点共享第104页
        4.3.3 时钟关断第104-105页
        4.3.4 静态目标缓存第105页
        4.3.5 LOD技术第105-106页
        4.3.6 实验与分析第106-109页
    4.4 硬件功耗优化技术第109-120页
        4.4.1 插入门控时钟第109-110页
        4.4.2 多阈值技术的实现第110页
        4.4.3 基于UPF实现多电压域及门控电源第110-117页
        4.4.4 实验与分析第117-120页
    4.5 本章小结第120-123页
第五章 面向能耗感知的PE调度器设计第123-131页
    5.1 阿姆达尔定律第123-124页
    5.2 利用Amdahl定律对Firefly2处理器进行功耗建模第124-126页
    5.3 调度算法第126-129页
    5.4 PE调度器的设计第129-130页
        5.4.1 基于性能计数器获得PE能耗第129页
        5.4.2 调度器的设计第129-130页
    5.5 本章小结第130-131页
第六章 总结与展望第131-135页
    6.1 论文工作总结第131-132页
    6.2 工作展望第132-135页
参考文献第135-149页
致谢第149-151页
作者简介第151-153页

论文共153页,点击 下载论文
上一篇:高精度逐次逼近型ADC及其校准技术研究
下一篇:太赫兹无源器件的设计与工艺实现