摘要 | 第1-13页 |
ABSTRACT | 第13-15页 |
第一章 引言 | 第15-29页 |
·课题研究背景及意义 | 第15-20页 |
·输运理论简介 | 第15页 |
·以粒子输运模拟为代表的高性能应用面临的挑战 | 第15-16页 |
·异构并行计算带来的机遇和挑战 | 第16-18页 |
·研究意义 | 第18-20页 |
·国内外研究现状 | 第20-24页 |
·粒子输运的并行算法研究 | 第20-22页 |
·面向异构体系结构的并行算法研究 | 第22-24页 |
·本文的研究内容和主要贡献 | 第24-26页 |
·本文的研究内容 | 第24-25页 |
·本文的主要贡献 | 第25-26页 |
·论文结构 | 第26-29页 |
第二章 相关工作 | 第29-49页 |
·粒子输运模型及其数值方法 | 第29-40页 |
·粒子输运的基本概念 | 第29-30页 |
·输运方程的一般形式及定解条件 | 第30-31页 |
·输运方程的确定性数值近似解法 | 第31-33页 |
·三维笛卡尔坐标下的输运方程 | 第33-34页 |
·三维笛卡尔坐标下的输运问题的差分方程 | 第34-35页 |
·二维柱坐标下的输运方程 | 第35-36页 |
·二维柱坐标下的输运问题的间断有限元方程 | 第36-37页 |
·离散纵标方法 | 第37-38页 |
·间断有限元法 | 第38-39页 |
·源迭代方法 | 第39页 |
·粒子输运的非确定性模拟 | 第39-40页 |
·异构体系结构 | 第40-45页 |
·分类、特征及趋势 | 第40-42页 |
·典型的协处理单元 | 第42-45页 |
·高性能计算领域异构体系结构面临的挑战 | 第45页 |
·GPU 硬件架构及编程模型 | 第45-49页 |
第三章 基于GPU 的粒子输运三维确定性结构化网格数据级并行扫描算法 | 第49-71页 |
·问题提出 | 第49-50页 |
·相关研究 | 第50-53页 |
·基于GPU 的数据级通量扫描算法 | 第53-60页 |
·基本的线程级并行扫描 | 第54-55页 |
·从P_n 矩中计算源项 | 第55-56页 |
·求解递归的S_n 方程 | 第56-57页 |
·更新来自P_n 矩的粒子通量和DSA 面流 | 第57-59页 |
·其它过程 | 第59-60页 |
·算法分析 | 第60-61页 |
·并行度模型及分析 | 第60-61页 |
·数值实验和讨论 | 第61-68页 |
·实验平台和问题模型 | 第61-62页 |
·基本数据级并行扫描 | 第62-63页 |
·模拟的收敛性 | 第63页 |
·不进行通量修正的性能 | 第63-64页 |
·S_n 递归方程并行化的效果 | 第64-65页 |
·GPU 和CPU 实现的细节比较 | 第65-66页 |
·进行通量修正时粒子输运的性能 | 第66-67页 |
·讨论 | 第67-68页 |
·小结 | 第68-71页 |
第四章 基于GPU 的粒子输运二维确定性非结构化网格数据级并行扫描算法 | 第71-91页 |
·问题提出 | 第71-72页 |
·相关研究 | 第72-74页 |
·基于GPU 的数据级扫描算法 | 第74-79页 |
·预扫描算法:确定扫描顺序 | 第74-76页 |
·映射并行通量扫描计算到GPU 线程执行模型 | 第76-77页 |
·其它过程 | 第77-78页 |
·优化 | 第78-79页 |
·算法分析 | 第79-84页 |
·预扫描算法的可行性分析 | 第79-80页 |
·并行度分析 | 第80-82页 |
·层次式异构并行算法设计方法:从循环展开与分割的角度 | 第82-84页 |
·数值实验和讨论 | 第84-90页 |
·实验平台和问题模型 | 第84-85页 |
·模拟的收敛性 | 第85-86页 |
·数据级并行通量扫描算法的性质 | 第86-87页 |
·性能比较 | 第87-89页 |
·讨论 | 第89-90页 |
·小结 | 第90-91页 |
第五章 基于GPU 的非确定性粒子输运数据级并行算法 | 第91-113页 |
·问题提出 | 第91-93页 |
·相关研究 | 第93-96页 |
·基于GPU 的数据级并行MC 模拟算法 | 第96-104页 |
·算法总体流程 | 第96-97页 |
·并行访存冲突的消除:引入新型数据结构 | 第97-99页 |
·GPU 多线程并行 | 第99页 |
·基于GPU 的并行伪随机数发生器 | 第99-101页 |
·基于GPU 的方向角分布抽样 | 第101-102页 |
·优化 | 第102-104页 |
·算法分析 | 第104-106页 |
·存储事务模型 | 第104-106页 |
·面向异构体系结构的算法设计优化方法简述 | 第106页 |
·数值实验和讨论 | 第106-111页 |
·测试平台 | 第106页 |
·并行伪随机数测试结果 | 第106-109页 |
·角分布抽样测试结果 | 第109-110页 |
·MCNP-GPU 测试结果 | 第110页 |
·讨论 | 第110-111页 |
·小结 | 第111-113页 |
第六章 面向异构体系结构可扩展粒子输运并行框架设计与实现 | 第113-131页 |
·问题提出 | 第113-114页 |
·相关研究 | 第114-117页 |
·面向异构体系结构的可扩展粒子输运并行框架设计 | 第117-124页 |
·层次结构 | 第118-119页 |
·异构类型定义 | 第119-120页 |
·数据结构设计 | 第120-121页 |
·模块设计 | 第121-122页 |
·接口设计 | 第122-123页 |
·代码和文档 | 第123-124页 |
·应用示例 | 第124-128页 |
·Sweep3D-multiGPU | 第124-126页 |
·Hybrid-EP | 第126-128页 |
·小结 | 第128-131页 |
第七章 结束语 | 第131-135页 |
·工作总结 | 第131-132页 |
·工作展望 | 第132-135页 |
致谢 | 第135-137页 |
参考文献 | 第137-153页 |
作者在学期间取得的学术成果 | 第153-154页 |