首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

GPU加速PQMRCGSTAB算法研究

摘要第1-11页
ABSTRACT第11-13页
第一章 引言第13-20页
   ·课题背景第13-15页
     ·GPU 计算第13-15页
     ·GPU 上加速稀疏线性系统第15页
   ·相关工作第15-16页
   ·面临的挑战第16-17页
   ·本文研究内容和创新第17-19页
   ·本文结构第19-20页
第二章 GPU 和PQMRCGSTAB 算法第20-28页
   ·NVIDIA GPU第20-23页
     ·GT200 体系结构第20-21页
     ·编程模型第21-23页
   ·AMD GPU第23-25页
     ·Radeon R700 体系结构第23-24页
     ·编程模型第24-25页
   ·PQMRCGSTAB 算法第25-28页
     ·PQMRCGSTAB 算法介绍第25-27页
     ·QMRCGSTAB 算法加速研究第27-28页
第三章 PQMRCGSTAB 算法在单GPU 平台上的移植第28-43页
   ·数据处理方法第28-31页
     ·稀疏矩阵处理方法第28-29页
     ·文中带状稀疏矩阵处理方法第29-31页
   ·任务分配方法第31-32页
   ·计算核心的划分方法第32-34页
     ·计算核心启动开销统计方法第32页
     ·计算核心开销对性能的影响第32-33页
     ·计算核心划分方法第33-34页
   ·归约操作在NVIDIA GPU 上的高效实现第34-40页
     ·全在CPU 上实现的归约第34-35页
     ·全在GPU 上实现的归约第35-38页
     ·CPU+GPU 混合归约方法第38-40页
   ·与平台相关的优化方法第40-42页
     ·高速存储部件的利用第40-42页
     ·数据结构的优化第42页
   ·本章小结第42-43页
第四章 PQMRCGSTAB 算法在多GPU 平台上的移植第43-50页
   ·多GPU 加速技术第43-46页
     ·SLI 技术介绍第43-44页
     ·CrossFire 介绍第44页
     ·相关研究第44-46页
   ·多GPU 之间的数据共享第46-49页
     ·任务分配第46页
     ·数据共享第46-49页
   ·本章小结第49-50页
第五章 性能评测第50-55页
   ·实验环境第50-51页
   ·单GPU 平台上的测试结果第51-52页
     ·NVIDIA GPU第51-52页
     ·AMD GPU第52页
   ·多GPU 平台上测试结果第52-55页
     ·4 核CPU+NVIDIA S1070 性能第53页
     ·2 核CPU+Radeon HD 4870 X2 性能第53-54页
     ·通信开销统计第54-55页
第六章 结束语第55-57页
   ·工作总结第55-56页
   ·展望第56-57页
致谢第57-58页
参考文献第58-61页
作者在读期间取得的学术成果第61页

论文共61页,点击 下载论文
上一篇:面向构件部署与配置的模型语义保障机制研究与实现
下一篇:面向过程挖掘的一致性分析方法研究