高效能GPGPU体系结构关键技术研究

摘要	第1-14页
Abstract	第14-17页
第一章绪论	第17-41页
·研究背景	第17-26页
·工艺技术进步对处理器设计带来的机遇和挑战	第17-19页
·高性能计算领域应用需求对处理器体系结构设计的挑战	第19-23页
·GPU 在通用计算领域中的应用和发展	第23-26页
·课题动机	第26-30页
·GPGPU 对高性能计算领域带来的机遇	第26-28页
·GPGPU 在高性能计算领域中面临的挑战	第28-30页
·国内外相关研究工作	第30-35页
·GPGPU 应用映射及性能优化技术研究	第30-32页
·GPGPU 效能及功耗模型研究	第32-34页
·GPGPU 可靠性及容错技术研究	第34-35页
·研究内容	第35-37页
·主要工作与创新	第37-39页
·论文结构	第39-41页
第二章 GPGPU 体系结构及开发平台	第41-65页
·图形处理器发展历程	第41-45页
·传统图形处理器发展概述	第41-42页
·GPU 图形流水线的发展历程	第42-45页
·基于GPU 的通用计算研究概述	第45-49页
·统一架构GPU 之前的GPGPU 领域	第45-47页
·基于统一架构GPU 的GPGPU 研究	第47-49页
·统一架构GPU 体系结构	第49-54页
·NVIDIA 统一架构GPU 体系结构	第49-52页
·AMD 统一架构GPU 体系结构	第52-53页
·Larrabee 图形处理器	第53-54页
·GPGPU 开发平台	第54-62页
·CUDA 开发平台	第55-57页
·AMD Stream SDK	第57-58页
·OpenCL 并行编程框架	第58-61页
·其它语言及开发平台	第61-62页
·小结	第62-65页
第三章 GPGPU 应用映射及负载均衡策略研究	第65-91页
·GPGPU 应用映射及优化策略概述	第65-68页
·GPGPU 存储层次研究	第68-73页
·GPGPU 存储层次结构	第68-69页
·异构计算平台中Host 与GPGPU 之间的传输带宽分析	第69-72页
·共享存储器的空间分配	第72-73页
·片上计算资源与前端总线带宽之间的配置关系	第73-75页
·细粒度配置实验结果及分析	第74页
·粗粒度配置验证结果及分析	第74-75页
·基于GPGPU 的异构系统负载均衡策略研究	第75-84页
·矩阵乘算法基本优化策略	第76-78页
·指令级预取策略	第78-79页
·基于流计算的访存延时隐藏策略	第79-81页
·系统级任务划分策略	第81-83页
·基于流计算的系统级任务划分策略	第83-84页
·高性能Linpack 测试程序在GPGPU 上的映射和加速	第84-89页
·高性能Linpack 概述	第84-85页
·在异构计算平台上实现HPL 加速	第85-89页
·小结	第89-91页
第四章 GPGPU 体系结构级功耗模型	第91-125页
·传统微处理器功耗研究	第91-94页
·传统微处理器功耗不断增加所带来的问题	第91-93页
·微处理器电路的功耗组成	第93-94页
·GPGPU 功耗研究	第94-96页
·GPGPU 功耗概述	第94-95页
·GPGPU 功耗建模方法学	第95-96页
·GPGPU 基准体系结构模型	第96-101页
·GT200 体系结构	第97-98页
·GT200 微体系结构	第98-100页
·基于GT200 的微体系结构改进和通用化处理	第100-101页
·GPGPU-sim 主要部件功耗估算模型	第101-116页
·Cache 的动态和静态功耗模型	第102-108页
·共享存储器的动态和静态功耗模型	第108页
·寄存器文件的动态和静态功耗模型	第108-109页
·存取队列的动态和静态功耗模型	第109-113页
·互连网络的动态和静态功耗模型	第113-116页
·计算单元和全局存储器的功耗模型	第116页
·参数化功耗模型的工艺缩放	第116-118页
·功耗模型的工艺缩放原则	第116-118页
·GPGPU 功耗模型的工艺参数设置	第118页
·功耗模型实现与验证	第118-124页
·功耗模型实现	第118-121页
·功耗模型验证及结果分析	第121-124页
·小结	第124-125页
第五章 GPGPU 并行容错算法及低开销容错设计技术	第125-149页
·GPGPU 可靠性研究缘起	第125-128页
·GPGPU 体系结构可靠性设计	第125-127页
·GPGPU 可靠性相关研究	第127-128页
·GPGPU 容错模型	第128-135页
·传统微处理器容错	第129-131页
·GPGPU 容错策略研究	第131-133页
·可靠性评估模型	第133-135页
·基于时间冗余的GPGPU 并行容错算法设计	第135-142页
·GPGPU 并行容错算法设计策略	第135-139页
·实验设计	第139-140页
·实验结果及分析	第140-142页
·存储部件的低开销容错设计	第142-147页
·AVF 评估框架	第142-143页
·BART 预测方法	第143-145页
·L1D Cache AVF 动态特性分析	第145页
·AVF-aware ECC 低开销容错设计	第145-147页
·小结	第147-149页
第六章结论与展望	第149-155页
·工作总结	第149-152页
·未来研究方向	第152-155页
致谢	第155-157页
参考文献	第157-173页
作者在学期间取得的学术成果	第173-175页