首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

面向大规模科学计算的CPU-GPU异构并行技术研究

摘要第1-10页
ABSTRACT第10-11页
第一章 绪论第11-23页
   ·课题研究背景第11-20页
     ·GPU的历史和发展现状第12-14页
     ·CPU-GPU异构系统体系结构第14-15页
     ·主流GPU体系结构第15-17页
     ·GPU编程模型第17-20页
   ·相关研究第20-21页
   ·论文的主要工作第21-22页
   ·论文结构第22-23页
第二章 AMD 流处理器体系结构及编程模型第23-28页
   ·AMD流处理器芯片结构第23-24页
   ·Brook+流编程模型第24-27页
     ·两级抽象模型第24-25页
     ·流编程模型特点第25-27页
   ·流程序的编译与执行第27-28页
第三章 面向大规模科学计算的CPU-GPU异构并行技术第28-40页
   ·基于CPU-GPU异构平台优化策略第28-35页
     ·CPU-GPU任务划分第28-32页
     ·CPU-GPU通信优化第32-35页
   ·基于GPU流处理的优化方法第35-39页
     ·平衡线程并行性和局部性第35-36页
     ·分支消除第36-38页
     ·开发指令级并行第38页
     ·提高存储带宽利用率第38-39页
   ·异构平台优化方法小结第39-40页
第四章 典型科学计算应用的流化和优化第40-61页
   ·矩阵乘的流化和优化第40-46页
     ·矩阵乘流化方法第40-41页
     ·矩阵乘优化方法第41-45页
     ·矩阵乘优化方法小结第45-46页
   ·LU分解的流化和优化第46-56页
     ·LU分解算法分析第46-48页
     ·LU分解流化方法第48-51页
     ·LU分解优化方法第51-55页
     ·LU分解优化方法小结第55-56页
   ·Mgrid的流化和优化第56-61页
     ·Mgrid算法分析第56-57页
     ·Mgrid流化方法第57页
     ·Mgrid优化方法第57-60页
     ·Mgrid优化方法小结第60-61页
第五章 实验和结果分析第61-76页
   ·矩阵乘测试及结果分析第61-66页
     ·矩阵乘的简单流化实现第61-62页
     ·矩阵乘的优化实现第62-65页
     ·矩阵乘优化效果总结第65-66页
   ·LU分解测试及结果分析第66-70页
     ·LU分解算法的简单流化实现第66-67页
     ·LU分解算法的优化实现第67-69页
     ·LU分解算法优化效果总结第69-70页
   ·Mgrid测试及结果分析第70-75页
     ·Mgrid的流化及优化实现第70-74页
     ·Mgrid优化效果总结第74-75页
   ·测试总结第75-76页
第六章 结束语第76-77页
致谢第77-78页
参考文献第78-82页
作者在学期间取得的学术成果第82页

论文共82页,点击 下载论文
上一篇:支持异构网络存储服务的YaFS文件系统研究与实现
下一篇:固态驱动器的模拟及性能优化技术研究