嵌入式GPU中统一染色器核的研究与设计
摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
符号对照表 | 第12-13页 |
缩略语对照表 | 第13-16页 |
第一章 绪论 | 第16-22页 |
1.1 GPU的研究意义 | 第16页 |
1.2 GPU的历史和发展 | 第16-18页 |
1.2.1 历史 | 第16-18页 |
1.2.2 发展 | 第18页 |
1.3 论文所做的主要工作 | 第18-19页 |
1.4 本文结构 | 第19-22页 |
第二章 图形处理器架构的研究 | 第22-52页 |
2.1 GPU图形管线发展 | 第22-24页 |
2.1.1 GPU中图形处理流水线 | 第22页 |
2.1.2 非统一架构的图形管线 | 第22-23页 |
2.1.3 统一架构的图形管线 | 第23-24页 |
2.2 GPU产品架构发展 | 第24-37页 |
2.2.1 NVIDIA架构历程 | 第25-34页 |
2.2.2 AMD架构历程 | 第34-37页 |
2.3 关键算法分析 | 第37-50页 |
2.3.1 顶点坐标转换 | 第37-47页 |
2.3.2 光照计算 | 第47-50页 |
2.4 本章小结 | 第50-52页 |
第三章 统一染色器核体系架构的研究 | 第52-68页 |
3.1 指令集体系 | 第52-57页 |
3.1.1 数据格式 | 第52-53页 |
3.1.2 指令系统 | 第53页 |
3.1.3 指令格式 | 第53-54页 |
3.1.4 寻址方式 | 第54-55页 |
3.1.5 寄存器设置 | 第55页 |
3.1.6 指令相关类型 | 第55-57页 |
3.1.7 指令相关的解决方案 | 第57页 |
3.2 统一染色器核的架构 | 第57-66页 |
3.2.1 性能提升思路 | 第57-58页 |
3.2.2 SIMT调度执行技术 | 第58-61页 |
3.2.3 流水线的划分 | 第61-63页 |
3.2.4 整体架构 | 第63-66页 |
3.3 本章小结 | 第66-68页 |
第四章 独立功能模块的设计 | 第68-84页 |
4.1 指令双发射的设计 | 第68-72页 |
4.1.1 指令发射方案 | 第68-69页 |
4.1.2 分发(Dispatch)阶段 | 第69页 |
4.1.3 发射(Issue)阶段 | 第69-71页 |
4.1.4 单元架构设计 | 第71-72页 |
4.2 光照计算单元的设计 | 第72-82页 |
4.2.1 光照算法分析 | 第73-74页 |
4.2.2 数字系统转换 | 第74-76页 |
4.2.3 单元架构设计 | 第76-82页 |
4.3 本章小结 | 第82-84页 |
第五章 功能验证 | 第84-98页 |
5.1 虚拟仿真 | 第85-91页 |
5.1.1 模块级验证 | 第85-89页 |
5.1.2 系统级验证 | 第89-91页 |
5.2 FPGA验证 | 第91-94页 |
5.2.1 FPGA验证方案 | 第91页 |
5.2.2 FPGA验证过程 | 第91-94页 |
5.3 性能分析 | 第94-96页 |
5.4 本章小结 | 第96-98页 |
第六章 总结与展望 | 第98-100页 |
6.1 本文工作总结 | 第98页 |
6.2 今后工作展望 | 第98-100页 |
参考文献 | 第100-104页 |
致谢 | 第104-106页 |
作者简介 | 第106页 |