首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

面向异构体系结构的粒子输运并行算法研究

摘要第1-13页
ABSTRACT第13-15页
第一章 引言第15-29页
   ·课题研究背景及意义第15-20页
     ·输运理论简介第15页
     ·以粒子输运模拟为代表的高性能应用面临的挑战第15-16页
     ·异构并行计算带来的机遇和挑战第16-18页
     ·研究意义第18-20页
   ·国内外研究现状第20-24页
     ·粒子输运的并行算法研究第20-22页
     ·面向异构体系结构的并行算法研究第22-24页
   ·本文的研究内容和主要贡献第24-26页
     ·本文的研究内容第24-25页
     ·本文的主要贡献第25-26页
   ·论文结构第26-29页
第二章 相关工作第29-49页
   ·粒子输运模型及其数值方法第29-40页
     ·粒子输运的基本概念第29-30页
     ·输运方程的一般形式及定解条件第30-31页
     ·输运方程的确定性数值近似解法第31-33页
     ·三维笛卡尔坐标下的输运方程第33-34页
     ·三维笛卡尔坐标下的输运问题的差分方程第34-35页
     ·二维柱坐标下的输运方程第35-36页
     ·二维柱坐标下的输运问题的间断有限元方程第36-37页
     ·离散纵标方法第37-38页
     ·间断有限元法第38-39页
     ·源迭代方法第39页
     ·粒子输运的非确定性模拟第39-40页
   ·异构体系结构第40-45页
     ·分类、特征及趋势第40-42页
     ·典型的协处理单元第42-45页
     ·高性能计算领域异构体系结构面临的挑战第45页
   ·GPU 硬件架构及编程模型第45-49页
第三章 基于GPU 的粒子输运三维确定性结构化网格数据级并行扫描算法第49-71页
   ·问题提出第49-50页
   ·相关研究第50-53页
   ·基于GPU 的数据级通量扫描算法第53-60页
     ·基本的线程级并行扫描第54-55页
     ·从P_n 矩中计算源项第55-56页
     ·求解递归的S_n 方程第56-57页
     ·更新来自P_n 矩的粒子通量和DSA 面流第57-59页
     ·其它过程第59-60页
   ·算法分析第60-61页
     ·并行度模型及分析第60-61页
   ·数值实验和讨论第61-68页
     ·实验平台和问题模型第61-62页
     ·基本数据级并行扫描第62-63页
     ·模拟的收敛性第63页
     ·不进行通量修正的性能第63-64页
     ·S_n 递归方程并行化的效果第64-65页
     ·GPU 和CPU 实现的细节比较第65-66页
     ·进行通量修正时粒子输运的性能第66-67页
     ·讨论第67-68页
   ·小结第68-71页
第四章 基于GPU 的粒子输运二维确定性非结构化网格数据级并行扫描算法第71-91页
   ·问题提出第71-72页
   ·相关研究第72-74页
   ·基于GPU 的数据级扫描算法第74-79页
     ·预扫描算法:确定扫描顺序第74-76页
     ·映射并行通量扫描计算到GPU 线程执行模型第76-77页
     ·其它过程第77-78页
     ·优化第78-79页
   ·算法分析第79-84页
     ·预扫描算法的可行性分析第79-80页
     ·并行度分析第80-82页
     ·层次式异构并行算法设计方法:从循环展开与分割的角度第82-84页
   ·数值实验和讨论第84-90页
     ·实验平台和问题模型第84-85页
     ·模拟的收敛性第85-86页
     ·数据级并行通量扫描算法的性质第86-87页
     ·性能比较第87-89页
     ·讨论第89-90页
   ·小结第90-91页
第五章 基于GPU 的非确定性粒子输运数据级并行算法第91-113页
   ·问题提出第91-93页
   ·相关研究第93-96页
   ·基于GPU 的数据级并行MC 模拟算法第96-104页
     ·算法总体流程第96-97页
     ·并行访存冲突的消除:引入新型数据结构第97-99页
     ·GPU 多线程并行第99页
     ·基于GPU 的并行伪随机数发生器第99-101页
     ·基于GPU 的方向角分布抽样第101-102页
     ·优化第102-104页
   ·算法分析第104-106页
     ·存储事务模型第104-106页
     ·面向异构体系结构的算法设计优化方法简述第106页
   ·数值实验和讨论第106-111页
     ·测试平台第106页
     ·并行伪随机数测试结果第106-109页
     ·角分布抽样测试结果第109-110页
     ·MCNP-GPU 测试结果第110页
     ·讨论第110-111页
   ·小结第111-113页
第六章 面向异构体系结构可扩展粒子输运并行框架设计与实现第113-131页
   ·问题提出第113-114页
   ·相关研究第114-117页
   ·面向异构体系结构的可扩展粒子输运并行框架设计第117-124页
     ·层次结构第118-119页
     ·异构类型定义第119-120页
     ·数据结构设计第120-121页
     ·模块设计第121-122页
     ·接口设计第122-123页
     ·代码和文档第123-124页
   ·应用示例第124-128页
     ·Sweep3D-multiGPU第124-126页
     ·Hybrid-EP第126-128页
   ·小结第128-131页
第七章 结束语第131-135页
   ·工作总结第131-132页
   ·工作展望第132-135页
致谢第135-137页
参考文献第137-153页
作者在学期间取得的学术成果第153-154页

论文共154页,点击 下载论文
上一篇:面向应用的指令集处理器关键技术研究
下一篇:星载分布式InSAR系统的误差分析与DEM精度提高方法研究