首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--汇编程序论文

PTX程序性能分析与建模

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-18页
   ·课题研究背景及意义第11-12页
   ·GPU 通用计算第12-15页
     ·GPU 发展历程第12-13页
     ·GPGPU第13-14页
     ·GPU 通用计算的特点第14页
     ·GPU 通用计算平台第14-15页
   ·GPU 体系及编程模型第15-16页
     ·GPU 体系第15页
     ·CUDA 软件编程接口第15-16页
   ·论文的主要内容第16-18页
第2章 背景材料第18-29页
   ·GPGPU第18-22页
     ·GPGPU 简介第18-19页
     ·GPU 通用计算原理第19-20页
     ·Fermi 架构第20-22页
   ·CUDA 并行计算概述第22-25页
     ·一种通用并行计算架构第22-23页
     ·一种可扩展的编程模型第23-24页
     ·NVCC—NVIDIA CUDA 编译驱动器第24-25页
   ·PTX(Parallel Thread Execution)第25-29页
     ·PTX 简介第25-26页
     ·PTX 编程模型第26-29页
第3章 PTX 指令统计程序第29-41页
   ·指令统计程序的意义第29页
   ·创建 CUDA 编程环境第29-31页
   ·编写向量加程序第31-32页
     ·CUDA C第31页
     ·编写向量加程序第31-32页
   ·通过 NVCC 编译器得到 PTX 指令第32-37页
   ·编写 PTX 指令统计程序第37-41页
第4章 PTX 指令性能分析第41-50页
   ·CUDA pipeline第41-45页
     ·GPU 的基本结构第43页
     ·执行过程第43-44页
     ·SM(shared memory)第44页
     ·奇偶 warp 调度器第44-45页
     ·调度器中的指令延迟(latency)第45页
   ·PTX 指令延迟第45-48页
     ·PTX 指令在硬件中的编译过程第45-46页
     ·指令延迟计算公式及创新点第46-48页
   ·指令性能分析之 IADD第48-50页
第5章 总结及展望第50-52页
   ·相关工作第50-51页
   ·全文总结第51-52页
参考文献第52-54页
致谢第54页

论文共54页,点击 下载论文
上一篇:基于X射线图像获取和处理实现
下一篇:基于B样条及NURBS的等几何分析研究