摘要 | 第1-5页 |
Abstract | 第5-9页 |
第一章 引言 | 第9-15页 |
·研究工作的背景和意义 | 第9-12页 |
·本文研究工作的主要内容 | 第12-13页 |
·研究贡献 | 第13页 |
·本文内容结构安排 | 第13-15页 |
第二章 图形处理单元(GPU)简介 | 第15-22页 |
·图形处理单元的基本概念 | 第15页 |
·基于GPU 的通用计算(GPGPU)的原理 | 第15-17页 |
·软件开发环境 | 第17-20页 |
·Brook | 第17-19页 |
·Compute Unified Device Architecture (CUDA) | 第19-20页 |
·本文的软硬件环境 | 第20-22页 |
第三章 基于 GPU 的并行计算架构 | 第22-33页 |
·并行计算系统分类 | 第22-25页 |
·共享存储器多处理器系统 | 第23-24页 |
·消息传递多计算机系统 | 第24页 |
·分布式存储器系统 | 第24-25页 |
·并行算法设计原则 | 第25-28页 |
·任务分解 | 第25-27页 |
·粒度 | 第27页 |
·负载平衡 | 第27页 |
·加速比 | 第27-28页 |
·GPU:大规模并行处理器 | 第28-33页 |
·硬件架构模型 | 第29页 |
·内存模型 | 第29-30页 |
·GPU 算法设计的一般考虑 | 第30-31页 |
·GPU 性能优化策略 | 第31-33页 |
第四章 基于GPU 的并行矩量法 | 第33-56页 |
·矩量法简介 | 第33-38页 |
·面积分方程 | 第33-36页 |
·矩量法实现 | 第36-38页 |
·在GPU 上实现并行矩量法 | 第38-48页 |
·并行矩量法的具体实现 | 第38-40页 |
·矩阵分割算法 | 第40-41页 |
·优化奇异项计算 | 第41-45页 |
·数值结果及性能 | 第45-48页 |
·基于相位提取基函数(Phase-Extract Basis)的矩量法 | 第48-56页 |
·PE 基函数 | 第49-50页 |
·结合PE 基函数的并行矩量法实现 | 第50-51页 |
·数值结果及性能 | 第51-56页 |
第五章 基于GPU 的并行多层快速多极子方法 | 第56-71页 |
·多层快速多极子方法简介 | 第56-61页 |
·快速多极子方法 | 第56-58页 |
·多层快速多极子方法 | 第58-61页 |
·在GPU 上实现并行多层快速多极子方法 | 第61-71页 |
·并行MLFMA 的具体实现 | 第61-67页 |
·结合PE 基函数的并行多层快速多极子方法 | 第67页 |
·数值结果及性能 | 第67-71页 |
结束语 | 第71-73页 |
致谢 | 第73-74页 |
参考文献 | 第74-77页 |
攻硕期间取得的成果 | 第77-78页 |