首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--安全保密论文--加密与解密论文

基于GPU技术的并行运算应用研究

目录第1-8页
摘要第8-9页
ABSTRACT第9-11页
第一章 绪论第11-18页
   ·课题背景第11-15页
   ·论文研究的主要内容及面临的挑战第15-16页
   ·本文结构第16-18页
第二章 GPU 体系结构和 CUDA 编程模型第18-39页
   ·NVIDIA GPU 系统结构特点第18-21页
     ·GT200 体系结构第19-20页
     ·Fermi 体系结构第20-21页
   ·CUDA 编程模型第21-29页
     ·CUDA 的构成第21-22页
     ·CUDA 运算的调用说明第22-24页
     ·CUDA 存储结构介绍第24-27页
     ·CUDA 并行执行的层次说明第27页
     ·CUDA 计算核心介绍第27-28页
     ·CUDA 编程模型的常规优化方法第28-29页
   ·CUDA 算法设计第29-34页
     ·CUDA 模式下算法计算任务划分第29-30页
     ·CUDA 模式下算法计算核心划分第30-31页
     ·CUDA 算法的维度设计第31-33页
     ·CUDA 并行模块构建第33-34页
   ·CUDA 算法优化第34-38页
     ·并行执行单元线程的切换优化第34-35页
     ·合并访问对访存操作的优化设计第35-36页
     ·GPU 计算资源利用率优化第36-37页
     ·CUDA 模式下算法并发操作的执行优化第37-38页
   ·本章小结第38-39页
第三章 CUDA 模式下 DES 算法优化实现第39-58页
   ·DES 算法介绍第39-45页
   ·DES 算法并行实现面临的主要问题和优化策略第45-47页
     ·DES 算法实现的瓶颈问题第45-46页
     ·DES 算法实现的优化策略第46-47页
   ·DES 算法并行实现和执行优化第47-57页
     ·DES 算法计算任务划分第47-48页
     ·DES 算法计算核心划分第48-49页
     ·DES 算法并行规约运算优化第49-51页
     ·DES 算法分支操作优化第51-53页
     ·DES 算法 shared memory 优化第53-55页
     ·DES 算法流优化第55-56页
     ·DES 算法中主机与设备之间的数据通信优化第56-57页
   ·本章小结第57-58页
第四章 性能评测第58-67页
   ·实验环境第58-59页
   ·循环移位运算的测试结果第59-60页
   ·异或运算的测试结果第60-61页
   ·迭代运算的测试结果第61-62页
   ·异步执行的测试结果第62-63页
   ·循环控制语句优化的测试结果第63-64页
   ·DES 加密运算的优化结果第64-66页
   ·本章小结第66-67页
第五章 结束语第67-69页
   ·工作总结第67-68页
   ·展望第68-69页
致谢第69-70页
参考文献第70-73页
作者在读期间取得的学术成果第73页

论文共73页,点击 下载论文
上一篇:基于GCC的YHFT-Matrix编译器关键技术研究与实现
下一篇:警用飞行器红外下视地面目标匹配识别技术研究