首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

GPU加速的大规模岩土工程有限元计算中的迭代求解

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-8页
目录第8-11页
1 绪论第11-21页
   ·研究背景第11-12页
   ·并行计算现状第12-14页
     ·传统的有限元并行计算第12-13页
     ·GPU通用计算第13-14页
   ·有限元并行算法现状第14-17页
     ·局部并行求解法第14-15页
     ·区域分解法第15-16页
     ·EBE法第16-17页
   ·计算环境第17-18页
     ·软件环境第17页
     ·硬件环境第17-18页
   ·论文主要研究内容第18-21页
2 基于GPU的并行计算第21-35页
   ·引言第21页
   ·GPU和GPU通用计算第21-23页
   ·CUDA编程模模式第23-27页
     ·CUDA概述第23-24页
     ·内核(kernel)第24-25页
     ·线程层次第25-26页
     ·存储器层次结构和数据类型第26-27页
   ·CUDA Fortran并行程序设计第27-33页
     ·稠密矩阵乘积的设计第27-30页
     ·测试结果第30-33页
   ·本章小结第33-35页
3 大型线性方程组的求解第35-57页
   ·引言第35页
   ·有限元方程离散的线性方程组第35-42页
     ·固结理论概述第35页
     ·Terzaghi一维固结理论第35-36页
     ·Terzaghi-Rendulic固结理论第36-37页
     ·Biot固结理论第37-42页
   ·线性方程组的求解第42-49页
     ·线性方程组的求解方法第42-45页
     ·迭代预处理技术第45-47页
     ·PSQMR及并行计算原理第47-49页
   ·刚度矩阵的存储方法第49-52页
     ·等带宽存储法第49-50页
     ·一维变带宽存第50页
     ·CSC存储法和相关的存储法第50-51页
     ·EBE存储法第51-52页
     ·其他存储第52页
   ·稀疏矩阵矢量乘积第52-56页
     ·稀疏矩阵-矢量乘的CPU实现(SpMV-CPU))第52-54页
     ·稀疏矩阵-矢量乘GPU并行算法(SpMV-GPU1)第54-55页
     ·稀疏矩阵-矢量乘GPU并行算法的改进(SpMV-GPU2)第55-56页
   ·本章小结第56-57页
4 Biot固结问题求解性能的比较第57-67页
   ·引言第57页
   ·PGI Fortran与Intel Fortran编译器效率比较第57-58页
   ·求解效率对比第58-60页
     ·P3dBiot程序与Abaqus软件计算效率对比第58页
     ·稀疏存储法与EBE存储法比较第58-60页
   ·基于GPU的并行计算结果第60-65页
   ·本章小结第65-67页
5 土-结构相互作用问题的预处理技术与GPU加速的迭代求解第67-77页
   ·引言第67页
   ·最新提出的预处理技术第67-68页
     ·非精确分块对角预处理第67-68页
     ·分区块SSOR预处理第68页
   ·桩筏基础算例分析第68-75页
     ·不同弹性模量对结果影响第69-72页
     ·不同有限元网格划分对结果影响第72-74页
     ·不同线程块划分对结果影响第74-75页
   ·本章小结第75-77页
6 总结和未来工作第77-79页
   ·全文总结第77页
   ·未来工作第77-79页
参考文献第79-83页
附录A P3DBiot固结有限元程序第83-90页
 A.1 P3dBiot固结有限元程序简介第83页
 A.2 计算模型参数第83-84页
 A.3 主程序源代码第84-90页
附录B 输入文件和输出文件第90-93页
 B.1 程序数据输入文件第90-91页
 B.2 程序数据输出文件第91-92页
 B.3 程序与Abaqus计算结果验证第92-93页
作者简历第93-97页
学位论文数据集第97页

论文共97页,点击 下载论文
上一篇:北大方正畅流系统核心模块的设计与实现
下一篇:基于RFT的自动化测试系统设计与实现