首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

面向CPU/GPU异构体系结构的并行计算关键技术研究

目录第1-8页
表目录第8-9页
图目录第9-11页
摘要第11-13页
Abstract第13-15页
第一章 绪论第15-25页
   ·研究背景第15-21页
     ·CPU/GPU 异构高性能计算系统第15-18页
     ·GPU 高性能计算应用第18-19页
     ·并行计算研究面临的挑战第19-21页
   ·主要研究内容和贡献第21-23页
   ·论文结构第23-25页
第二章 并行计算关键技术研究综述第25-47页
   ·并行计算机体系结构第25-31页
     ·Flynn 分类法第26-27页
     ·并行计算机体系结构模型第27-29页
     ·并行计算机体系结构的发展趋势第29-31页
   ·并行计算模型第31-37页
     ·PRAM 类模型第31-33页
     ·BSP 类模型第33-35页
     ·LogP 类模型第35-37页
     ·异构并行计算模型第37页
   ·并行编程模型第37-42页
     ·数据并行模型第38-39页
     ·消息传递模型第39-40页
     ·共享变量模型第40-41页
     ·一些新兴编程模型第41-42页
   ·并行可扩展性模型第42-45页
     ·加速比模型第42-43页
     ·可扩展性度量指标第43-45页
   ·本章小结第45-47页
第三章 HLognGPM:面向 GPU 集群的并行计算模型第47-73页
   ·引言第47-48页
   ·相关工作第48-49页
   ·HLognGPM 通用并行计算模型第49-56页
     ·模型定义第51-52页
     ·模型应用第52-56页
   ·HLog3GPM 并行计算模型第56-62页
     ·参数测定方法第56-58页
     ·映射到 TH-1A 系统第58-62页
   ·模型的验证第62-70页
     ·实验方案第62-64页
     ·测试案例 NPB-EP第64-66页
     ·测试案例 NPB-CG第66-70页
   ·讨论第70-71页
   ·本章小结第71-73页
第四章 几种混合编程模型在 GPU 集群上的性能比较第73-95页
   ·引言第73-74页
   ·相关工作第74-76页
     ·编程模型第74-75页
     ·NPB 基准测试程序集第75-76页
   ·大型 GPU 集群的混合编程模型第76-78页
     ·MPI+CUDA(MC)混合编程模型第76-77页
     ·MPI+OpenMP/CUDA(MOC)混合编程模型第77-78页
   ·NPB 内核的高效混合实现第78-86页
     ·EP 程序的混合实现第78-80页
     ·CG 程序的混合实现第80-84页
     ·MG 程序的混合实现第84-86页
   ·混合模型的性能对比第86-92页
     ·性能评价准则第86-87页
     ·实验设计第87页
     ·性能分析第87-90页
     ·讨论第90-92页
   ·本章小结第92-95页
第五章 并行算法—GPU 集群组合的可扩展性研究第95-111页
   ·引言第95-96页
   ·相关工作第96-97页
   ·协同感知可扩展性模型第97-104页
     ·GPU 集群体系结构模型第97-98页
     ·模型的定义第98-100页
     ·可扩展性分析第100-102页
     ·可扩展模型使用方法第102-104页
   ·实验验证第104-110页
     ·实验设计第104-105页
     ·EP-GC组合的可扩展性分析第105-106页
     ·CG-GC组合的可扩展性分析第106-108页
     ·MG-GC组合的可扩展性分析第108-110页
   ·本章小结第110-111页
第六章 RRTM 长波辐射方案在 GPU 集群上的高效实现第111-129页
   ·引言第111-112页
   ·长波辐射物理过程第112-115页
     ·长波辐射过程第112-113页
     ·RRTM 长波辐射传输方案第113-115页
   ·异构混合并行算法设计第115-119页
     ·RRTM 程序执行特点第115-116页
     ·并行策略第116页
     ·负载平衡策略第116-118页
     ·异构混合并行算法第118-119页
   ·高效混合实现第119-122页
     ·GPU 程序优化第119-121页
     ·MOC 混合实现第121-122页
   ·数值实验及可扩展性分析第122-127页
     ·负载平衡策略的验证第122-124页
     ·RRTM 混合程序的计算效率第124-126页
     ·可扩展性分析第126-127页
   ·本章小结第127-129页
第七章 结论与展望第129-131页
   ·工作总结第129-130页
   ·研究展望第130-131页
致谢第131-133页
参考文献第133-151页
作者在学期间取得的学术成果第151-152页
作者在学期间参加的科研项目第152页

论文共152页,点击 下载论文
上一篇:大规模分布式存储系统中数据冗余技术研究
下一篇:面向服务应急响应的数据保护关键技术研究