摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
符号对照表 | 第14-15页 |
缩略语对照表 | 第15-21页 |
第一章 绪论 | 第21-37页 |
1.1 研究背景 | 第21-27页 |
1.1.1 GPU发展概况 | 第21-22页 |
1.1.2 并行计算 | 第22-23页 |
1.1.3 GPU发展面临的问题 | 第23-27页 |
1.2 相关研究工作 | 第27-32页 |
1.2.1 GPU体系结构发展 | 第27-28页 |
1.2.2 GPU负载特性和性能研究 | 第28-29页 |
1.2.3 GPU功耗建模与估计方面的研究 | 第29-30页 |
1.2.4 功耗优化技术研究 | 第30-32页 |
1.3 本文的工作和主要创新点 | 第32-34页 |
1.3.1 研究目标 | 第32-33页 |
1.3.2 研究内容 | 第33-34页 |
1.3.3 创新点 | 第34页 |
1.4 论文结构 | 第34-37页 |
第二章 Firefly2硬件体系结构设计 | 第37-65页 |
2.1 Firefly2编程模型 | 第37-38页 |
2.2 Firefly2架构设计 | 第38-48页 |
2.2.1 指令集结构 | 第38-39页 |
2.2.2 Firefly2系统结构 | 第39-40页 |
2.2.3 簇结构 | 第40-41页 |
2.2.4 簇控制器 | 第41页 |
2.2.5 行控制器 | 第41-42页 |
2.2.6 列控制器 | 第42页 |
2.2.7 处理器单元 | 第42-45页 |
2.2.8 数据传输 | 第45-47页 |
2.2.9 通信机制 | 第47-48页 |
2.3 Firefly2上的并行计算 | 第48-53页 |
2.3.1 数据级并行计算 | 第48-49页 |
2.3.2 线程级并行计算 | 第49页 |
2.3.3 操作级并行计算 | 第49-51页 |
2.3.4 分布式指令级并行计算 | 第51页 |
2.3.5 混合并行处理方式 | 第51-53页 |
2.4 在Firefly2上实现3D图形渲染 | 第53-58页 |
2.4.1 固定图形渲染管线的实现 | 第53-54页 |
2.4.2 统一渲染管线的实现 | 第54-58页 |
2.5 在Firefly2上实现计算机视觉 | 第58-62页 |
2.6 软件仿真环境 | 第62-63页 |
2.7 与相关工作的比较 | 第63-64页 |
2.8 本章小结 | 第64-65页 |
第三章 3D图形渲染管线的能耗建模及性能分析 | 第65-89页 |
3.1 3D图形渲染管线 | 第65-67页 |
3.1.1 渲染管线 | 第65-66页 |
3.1.2 图元 | 第66-67页 |
3.2 能耗建模 | 第67-75页 |
3.2.1 几何变换 | 第67-68页 |
3.2.2 顶点着色 | 第68-70页 |
3.2.3 视景体裁剪 | 第70-71页 |
3.2.4 背面剔除 | 第71-72页 |
3.2.5 扫描转换 | 第72页 |
3.2.6 像素着色 | 第72-74页 |
3.2.7 段操作 | 第74-75页 |
3.3 性能分析 | 第75-83页 |
3.3.1 着色器负载分析 | 第75-79页 |
3.3.2 存储器带宽分析 | 第79-82页 |
3.3.3 能耗估计模型 | 第82-83页 |
3.4 模型验证 | 第83-87页 |
3.4.1 实验平台和测试用例 | 第83-85页 |
3.4.2 结果与分析 | 第85-87页 |
3.5 本章小结 | 第87-89页 |
第四章 Firefly2处理器功耗优化 | 第89-123页 |
4.1 功耗组成与分析 | 第89-95页 |
4.1.1 动态功耗 | 第89-91页 |
4.1.2 静态功耗 | 第91-93页 |
4.1.3 功耗分析 | 第93-95页 |
4.2 低功耗设计技术 | 第95-103页 |
4.2.1 工艺级 | 第95页 |
4.2.2 电路级 | 第95页 |
4.2.3 逻辑级 | 第95-97页 |
4.2.4 RTL级 | 第97-98页 |
4.2.5 体系结构级 | 第98-99页 |
4.2.6 系统级 | 第99-103页 |
4.3 软件功耗优化技术 | 第103-109页 |
4.3.1 采用索引三角形列表 | 第103-104页 |
4.3.2 顶点共享 | 第104页 |
4.3.3 时钟关断 | 第104-105页 |
4.3.4 静态目标缓存 | 第105页 |
4.3.5 LOD技术 | 第105-106页 |
4.3.6 实验与分析 | 第106-109页 |
4.4 硬件功耗优化技术 | 第109-120页 |
4.4.1 插入门控时钟 | 第109-110页 |
4.4.2 多阈值技术的实现 | 第110页 |
4.4.3 基于UPF实现多电压域及门控电源 | 第110-117页 |
4.4.4 实验与分析 | 第117-120页 |
4.5 本章小结 | 第120-123页 |
第五章 面向能耗感知的PE调度器设计 | 第123-131页 |
5.1 阿姆达尔定律 | 第123-124页 |
5.2 利用Amdahl定律对Firefly2处理器进行功耗建模 | 第124-126页 |
5.3 调度算法 | 第126-129页 |
5.4 PE调度器的设计 | 第129-130页 |
5.4.1 基于性能计数器获得PE能耗 | 第129页 |
5.4.2 调度器的设计 | 第129-130页 |
5.5 本章小结 | 第130-131页 |
第六章 总结与展望 | 第131-135页 |
6.1 论文工作总结 | 第131-132页 |
6.2 工作展望 | 第132-135页 |
参考文献 | 第135-149页 |
致谢 | 第149-151页 |
作者简介 | 第151-153页 |