摘要 | 第1-7页 |
ABSTRACT | 第7-16页 |
第一章 绪论 | 第16-24页 |
·课题研究背景及意义 | 第16-17页 |
·通用GPU并行计算概述 | 第17-19页 |
·通用GPU并行计算现状 | 第19-22页 |
·论文的主要贡献 | 第22页 |
·论文的组织结构 | 第22-23页 |
·本章小结 | 第23-24页 |
第二章 Fermi架构GPU并行计算模型 | 第24-38页 |
·GPU硬件发展历史 | 第24-26页 |
·传统GPU硬件构架 | 第26-29页 |
·全局内存 | 第27-28页 |
·多处理器 | 第28-29页 |
·纹理内存 | 第29页 |
·Fermi架构GPU硬件的改进 | 第29-33页 |
·Fermi芯片概述 | 第30-31页 |
·第三代流多处理器 | 第31-33页 |
·CUDA开发原理概述 | 第33-37页 |
·Linux平台上的开发环境 | 第33-34页 |
·线程运行机制 | 第34-36页 |
·存储器访问规则 | 第36-37页 |
·本章小节 | 第37-38页 |
第三章 基于Fermi架构GPU的FDTD算法的实现与优化 | 第38-74页 |
·问题来源及相关背景知识 | 第38页 |
·经典FDTD算法与原理描述 | 第38-45页 |
·麦克斯韦方程组与Yee元胞 | 第38-42页 |
·三维空间中的FDTD算法 | 第42-45页 |
·并行化三维FDTD算法与实现 | 第45-60页 |
·实验模型的建立 | 第46-48页 |
·串行版本的FDTD | 第48-51页 |
·数据划分与并行化 | 第51-55页 |
·在两种不同结构GPU下的优化 | 第55-60页 |
·试验结果比较与分析 | 第60-72页 |
·实验结果 | 第60-61页 |
·精度与准度的比较 | 第61-64页 |
·GPU运行与CPU运行比较 | 第64-66页 |
·Fermi架构GPU下不同优化策略的对比 | 第66-72页 |
·本章小结 | 第72-74页 |
第四章 基于Fermi架构GPU并行算法优化分析 | 第74-86页 |
·问题来源 | 第74页 |
·Fermi架构GPU优化方法描述 | 第74-77页 |
·Fermi架构中的存储器层次 | 第74-76页 |
·两种优化方法的优劣 | 第76-77页 |
·不同数据划分的算法 | 第77-82页 |
·矩阵相乘 | 第77-80页 |
·KD树的并行构建算法 | 第80-82页 |
·实验结果与分析 | 第82-85页 |
·矩阵相乘结果分析 | 第82-84页 |
·KD树的并行构建算法结果分析 | 第84-85页 |
·本章小节 | 第85-86页 |
第五章 总结与展望 | 第86-88页 |
·总结 | 第86页 |
·展望 | 第86-88页 |
参考文献 | 第88-90页 |
致谢 | 第90-91页 |
研究成果及发表的学术论文 | 第91-92页 |
作者和导师简介 | 第92-93页 |
硕士研究生学位论文答辩委员会决议书 | 第93-94页 |