首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

基于GPU微体系结构的高性能计算研究

摘要第1-10页
ABSTRACT第10-11页
第一章 绪论第11-18页
   ·课题背景及意义第11-14页
   ·国内外研究现状及通用GPU数据处理模型第14-16页
     ·研究现状第14-15页
     ·通用 GPU 数据处理模式第15-16页
   ·课题研究内容与成果第16-17页
   ·本文结构第17-18页
第二章 GPU体系结构及CUDA编程平台介绍第18-34页
   ·引言第18-21页
     ·GPU发展历程第18-19页
     ·GPU计算模型第19-20页
     ·GPU专业术语第20-21页
   ·NVIDIA GPU体系结构介绍第21-28页
     ·G80/GT200 体系结构介绍第21-26页
     ·下一代体系结构Fermi前瞻第26-28页
   ·CUDA编程平台概述第28-32页
     ·CUDA编程模型第29-30页
     ·CUDA存储模型第30-32页
     ·CUDA 执行模型第32页
   ·算法性能测试平台第32-33页
   ·本章总结第33-34页
第三章 基于CUDA的排序算法研究第34-48页
   ·数组倒序问题第34-36页
   ·局部排序第36-42页
     ·奇偶排序算法第36-38页
     ·枚举排序算法第38-39页
     ·双调排序第39-42页
   ·全局排序第42-44页
   ·算法优化技术第44-47页
     ·体冲突消除技术第44-46页
     ·循环展开技术第46-47页
   ·本章总结第47-48页
第四章 基于CUDA的矩阵乘研究第48-61页
   ·矩阵-向量乘法第48-49页
     ·矩阵-向量算法介绍及其串行算法第48页
     ·矩阵-向量乘法的并行实现第48-49页
   ·矩阵乘算法应用映射第49-58页
     ·适用GPU矩阵乘算法介绍第50-51页
     ·矩阵乘纹理映射第51-53页
     ·增大计算量对矩阵乘的性能影响第53-54页
     ·矩阵乘算法改进第54-55页
     ·预取技术对矩阵乘性能影响第55-56页
     ·CUDA Visual Profiler矩阵乘分析第56-58页
   ·异构任务划分模式的设计与实现第58-60页
   ·本节小结第60-61页
第五章 模拟器验证第61-66页
   ·GPGPU-Sim模拟器介绍第61-62页
   ·模拟器模拟第62-65页
     ·SIMD分支处理模式第62-63页
     ·CUDA分支处理模式第63-64页
     ·矩阵乘改进技术模拟器模拟第64-65页
   ·本章小结第65-66页
第六章 结束语与工作展望第66-68页
   ·课题工作总结第66页
   ·工作展望第66-68页
致谢第68-69页
参考文献第69-72页
作者在学期间取得的学术成果第72页

论文共72页,点击 下载论文
上一篇:引入flash的多层次存储结构研究与实现
下一篇:基于NAND闪存的固态盘关键技术研究