摘要 | 第1-14页 |
Abstract | 第14-17页 |
第一章 绪论 | 第17-41页 |
·研究背景 | 第17-26页 |
·工艺技术进步对处理器设计带来的机遇和挑战 | 第17-19页 |
·高性能计算领域应用需求对处理器体系结构设计的挑战 | 第19-23页 |
·GPU 在通用计算领域中的应用和发展 | 第23-26页 |
·课题动机 | 第26-30页 |
·GPGPU 对高性能计算领域带来的机遇 | 第26-28页 |
·GPGPU 在高性能计算领域中面临的挑战 | 第28-30页 |
·国内外相关研究工作 | 第30-35页 |
·GPGPU 应用映射及性能优化技术研究 | 第30-32页 |
·GPGPU 效能及功耗模型研究 | 第32-34页 |
·GPGPU 可靠性及容错技术研究 | 第34-35页 |
·研究内容 | 第35-37页 |
·主要工作与创新 | 第37-39页 |
·论文结构 | 第39-41页 |
第二章 GPGPU 体系结构及开发平台 | 第41-65页 |
·图形处理器发展历程 | 第41-45页 |
·传统图形处理器发展概述 | 第41-42页 |
·GPU 图形流水线的发展历程 | 第42-45页 |
·基于GPU 的通用计算研究概述 | 第45-49页 |
·统一架构GPU 之前的GPGPU 领域 | 第45-47页 |
·基于统一架构GPU 的GPGPU 研究 | 第47-49页 |
·统一架构GPU 体系结构 | 第49-54页 |
·NVIDIA 统一架构GPU 体系结构 | 第49-52页 |
·AMD 统一架构GPU 体系结构 | 第52-53页 |
·Larrabee 图形处理器 | 第53-54页 |
·GPGPU 开发平台 | 第54-62页 |
·CUDA 开发平台 | 第55-57页 |
·AMD Stream SDK | 第57-58页 |
·OpenCL 并行编程框架 | 第58-61页 |
·其它语言及开发平台 | 第61-62页 |
·小结 | 第62-65页 |
第三章 GPGPU 应用映射及负载均衡策略研究 | 第65-91页 |
·GPGPU 应用映射及优化策略概述 | 第65-68页 |
·GPGPU 存储层次研究 | 第68-73页 |
·GPGPU 存储层次结构 | 第68-69页 |
·异构计算平台中Host 与GPGPU 之间的传输带宽分析 | 第69-72页 |
·共享存储器的空间分配 | 第72-73页 |
·片上计算资源与前端总线带宽之间的配置关系 | 第73-75页 |
·细粒度配置实验结果及分析 | 第74页 |
·粗粒度配置验证结果及分析 | 第74-75页 |
·基于GPGPU 的异构系统负载均衡策略研究 | 第75-84页 |
·矩阵乘算法基本优化策略 | 第76-78页 |
·指令级预取策略 | 第78-79页 |
·基于流计算的访存延时隐藏策略 | 第79-81页 |
·系统级任务划分策略 | 第81-83页 |
·基于流计算的系统级任务划分策略 | 第83-84页 |
·高性能Linpack 测试程序在GPGPU 上的映射和加速 | 第84-89页 |
·高性能Linpack 概述 | 第84-85页 |
·在异构计算平台上实现HPL 加速 | 第85-89页 |
·小结 | 第89-91页 |
第四章 GPGPU 体系结构级功耗模型 | 第91-125页 |
·传统微处理器功耗研究 | 第91-94页 |
·传统微处理器功耗不断增加所带来的问题 | 第91-93页 |
·微处理器电路的功耗组成 | 第93-94页 |
·GPGPU 功耗研究 | 第94-96页 |
·GPGPU 功耗概述 | 第94-95页 |
·GPGPU 功耗建模方法学 | 第95-96页 |
·GPGPU 基准体系结构模型 | 第96-101页 |
·GT200 体系结构 | 第97-98页 |
·GT200 微体系结构 | 第98-100页 |
·基于GT200 的微体系结构改进和通用化处理 | 第100-101页 |
·GPGPU-sim 主要部件功耗估算模型 | 第101-116页 |
·Cache 的动态和静态功耗模型 | 第102-108页 |
·共享存储器的动态和静态功耗模型 | 第108页 |
·寄存器文件的动态和静态功耗模型 | 第108-109页 |
·存取队列的动态和静态功耗模型 | 第109-113页 |
·互连网络的动态和静态功耗模型 | 第113-116页 |
·计算单元和全局存储器的功耗模型 | 第116页 |
·参数化功耗模型的工艺缩放 | 第116-118页 |
·功耗模型的工艺缩放原则 | 第116-118页 |
·GPGPU 功耗模型的工艺参数设置 | 第118页 |
·功耗模型实现与验证 | 第118-124页 |
·功耗模型实现 | 第118-121页 |
·功耗模型验证及结果分析 | 第121-124页 |
·小结 | 第124-125页 |
第五章 GPGPU 并行容错算法及低开销容错设计技术 | 第125-149页 |
·GPGPU 可靠性研究缘起 | 第125-128页 |
·GPGPU 体系结构可靠性设计 | 第125-127页 |
·GPGPU 可靠性相关研究 | 第127-128页 |
·GPGPU 容错模型 | 第128-135页 |
·传统微处理器容错 | 第129-131页 |
·GPGPU 容错策略研究 | 第131-133页 |
·可靠性评估模型 | 第133-135页 |
·基于时间冗余的GPGPU 并行容错算法设计 | 第135-142页 |
·GPGPU 并行容错算法设计策略 | 第135-139页 |
·实验设计 | 第139-140页 |
·实验结果及分析 | 第140-142页 |
·存储部件的低开销容错设计 | 第142-147页 |
·AVF 评估框架 | 第142-143页 |
·BART 预测方法 | 第143-145页 |
·L1D Cache AVF 动态特性分析 | 第145页 |
·AVF-aware ECC 低开销容错设计 | 第145-147页 |
·小结 | 第147-149页 |
第六章 结论与展望 | 第149-155页 |
·工作总结 | 第149-152页 |
·未来研究方向 | 第152-155页 |
致谢 | 第155-157页 |
参考文献 | 第157-173页 |
作者在学期间取得的学术成果 | 第173-175页 |