嵌入式GPU中统一染色器核的研究与设计
| 摘要 | 第5-7页 |
| ABSTRACT | 第7-8页 |
| 符号对照表 | 第12-13页 |
| 缩略语对照表 | 第13-16页 |
| 第一章 绪论 | 第16-22页 |
| 1.1 GPU的研究意义 | 第16页 |
| 1.2 GPU的历史和发展 | 第16-18页 |
| 1.2.1 历史 | 第16-18页 |
| 1.2.2 发展 | 第18页 |
| 1.3 论文所做的主要工作 | 第18-19页 |
| 1.4 本文结构 | 第19-22页 |
| 第二章 图形处理器架构的研究 | 第22-52页 |
| 2.1 GPU图形管线发展 | 第22-24页 |
| 2.1.1 GPU中图形处理流水线 | 第22页 |
| 2.1.2 非统一架构的图形管线 | 第22-23页 |
| 2.1.3 统一架构的图形管线 | 第23-24页 |
| 2.2 GPU产品架构发展 | 第24-37页 |
| 2.2.1 NVIDIA架构历程 | 第25-34页 |
| 2.2.2 AMD架构历程 | 第34-37页 |
| 2.3 关键算法分析 | 第37-50页 |
| 2.3.1 顶点坐标转换 | 第37-47页 |
| 2.3.2 光照计算 | 第47-50页 |
| 2.4 本章小结 | 第50-52页 |
| 第三章 统一染色器核体系架构的研究 | 第52-68页 |
| 3.1 指令集体系 | 第52-57页 |
| 3.1.1 数据格式 | 第52-53页 |
| 3.1.2 指令系统 | 第53页 |
| 3.1.3 指令格式 | 第53-54页 |
| 3.1.4 寻址方式 | 第54-55页 |
| 3.1.5 寄存器设置 | 第55页 |
| 3.1.6 指令相关类型 | 第55-57页 |
| 3.1.7 指令相关的解决方案 | 第57页 |
| 3.2 统一染色器核的架构 | 第57-66页 |
| 3.2.1 性能提升思路 | 第57-58页 |
| 3.2.2 SIMT调度执行技术 | 第58-61页 |
| 3.2.3 流水线的划分 | 第61-63页 |
| 3.2.4 整体架构 | 第63-66页 |
| 3.3 本章小结 | 第66-68页 |
| 第四章 独立功能模块的设计 | 第68-84页 |
| 4.1 指令双发射的设计 | 第68-72页 |
| 4.1.1 指令发射方案 | 第68-69页 |
| 4.1.2 分发(Dispatch)阶段 | 第69页 |
| 4.1.3 发射(Issue)阶段 | 第69-71页 |
| 4.1.4 单元架构设计 | 第71-72页 |
| 4.2 光照计算单元的设计 | 第72-82页 |
| 4.2.1 光照算法分析 | 第73-74页 |
| 4.2.2 数字系统转换 | 第74-76页 |
| 4.2.3 单元架构设计 | 第76-82页 |
| 4.3 本章小结 | 第82-84页 |
| 第五章 功能验证 | 第84-98页 |
| 5.1 虚拟仿真 | 第85-91页 |
| 5.1.1 模块级验证 | 第85-89页 |
| 5.1.2 系统级验证 | 第89-91页 |
| 5.2 FPGA验证 | 第91-94页 |
| 5.2.1 FPGA验证方案 | 第91页 |
| 5.2.2 FPGA验证过程 | 第91-94页 |
| 5.3 性能分析 | 第94-96页 |
| 5.4 本章小结 | 第96-98页 |
| 第六章 总结与展望 | 第98-100页 |
| 6.1 本文工作总结 | 第98页 |
| 6.2 今后工作展望 | 第98-100页 |
| 参考文献 | 第100-104页 |
| 致谢 | 第104-106页 |
| 作者简介 | 第106页 |