首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

C到CUDA编译架构研究与实现

摘要第1-10页
Abstract第10-12页
第一章 绪论第12-22页
   ·研究背景与意义第12-16页
     ·多核/众核体系结构的发展第12-13页
     ·GPU 及编程模型的发展第13-16页
   ·CUDA 的研究现状第16-18页
   ·本文的主要工作第18-20页
     ·循环结构并行化代码调度方法第18-19页
     ·面向CUDA 存储模型的访存优化方法第19-20页
     ·C 到CUDA 并行化编译架构第20页
   ·本文的组织结构第20-22页
第二章 面向CUDA 的SUIF2 中间表示扩展第22-38页
   ·CUDA 的基本架构第22-26页
     ·CUDA 线程层次第22-24页
     ·CUDA 存储层次第24-26页
     ·CUDA 执行模型第26页
   ·SUIF2第26-35页
     ·SUIF2 的基本架构第27-29页
     ·SUIF2 的关键特征第29页
     ·SUIF2 修改方法第29-33页
     ·SUIF2 的中间表示第33-35页
   ·SUIF2 的CUDA 中间表示第35-36页
   ·小结第36-38页
第三章 ICuda 编译框架第38-44页
   ·相关研究工作第38-40页
   ·ICuda 框架第40-43页
     ·ICuda 核心架构第40-42页
     ·设计原则第42-43页
   ·小结第43-44页
第四章 代码变换和优化第44-57页
   ·数据下标变换方法第44-48页
     ·循环结构到多线程的映射第44-46页
     ·数据下标变换方法第46-48页
   ·共享变量分布式访问第48-52页
     ·循环结构数据依赖分析第49-51页
     ·共享变量优化第51-52页
   ·CUDA 的访存优化第52-56页
     ·经典访存优化方法第53页
     ·基于纹理空间的访存策略第53-55页
     ·基于数据分类技术的存储布局优化第55-56页
   ·小结第56-57页
第五章 性能测试与分析第57-65页
   ·实验平台与测试程序第57-58页
     ·实验平台第57页
     ·测试程序集第57-58页
   ·实验结果及分析第58-63页
     ·循环结构并行化代码调度方法的效果第58-59页
     ·CUDA 访存优化的效果第59-61页
     ·ICuda 的测试第61-63页
   ·小结第63-65页
第六章 结论与展望第65-67页
   ·全文总结第65-66页
   ·研究展望第66-67页
致谢第67-69页
参考文献第69-73页
作者在学期间取得的学术成果第73页

论文共73页,点击 下载论文
上一篇:CGF协同过程中的协商行为建模研究
下一篇:SAN集群文件系统性能优化研究与实现