基于异构系统的多对角矩阵并行计算研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第10-16页
1.1 研究背景与意义	第10-11页
1.2 国内外研究现状	第11-13页
1.3 本文主要工作及论文组织结构	第13-16页
1.3.1 本文主要工作	第13-14页
1.3.2 论文组织结构	第14-16页
第2章矩阵并行计算技术	第16-22页
2.1 多对角稀疏矩阵存储	第16-18页
2.2 稀疏矩阵向量乘法	第18-19页
2.3 矩阵求解算法	第19-21页
2.3.1 多重网格算法	第19-20页
2.3.2 Krylov子空间算法	第20-21页
2.4 本章小结	第21-22页
第3章 GRAPES赫姆霍兹方程并行求解方案	第22-42页
3.1 GRAPES赫姆霍兹方程	第22-26页
3.2 求解算法分析	第26-28页
3.2.1 网格粗化技术	第26-27页
3.2.2 限制算子和插值算子技术	第27页
3.2.3 平滑与求解操作	第27-28页
3.3 MPI多进程并行输入输出	第28-32页
3.3.1 MPI动态进程管理及设备更新	第29-31页
3.3.2 并行输入输出方案设计	第31-32页
3.4 MPI多进程并行计算方案	第32-36页
3.4.1 多进程数据划分	第32-34页
3.4.2 MPI多进程间点对点通信	第34-35页
3.4.3 规约与广播通信	第35-36页
3.5 OpenMP多线程并行计算方案	第36-38页
3.5.1 循环融合	第36-37页
3.5.2 向量化	第37-38页
3.6 并行计算主要功能函数	第38-41页
3.7 本章小结	第41-42页
第4章并行计算方案优化	第42-52页
4.1 几何多重网格算法的优化	第42-45页
4.2 GCR算法优化	第45-46页
4.3 GPU加速计算优化	第46-51页
4.3.1 GCR算法加速	第47-49页
4.3.2 Spmv操作加速	第49-51页
4.4 本章小结	第51-52页
第5章实验结果与分析	第52-62页
5.1 实验平台	第52页
5.2 实验用例	第52页
5.3 实验结果	第52-61页
5.3.1 GCR算法参数验证	第52-54页
5.3.2 多重网格求解方法测试	第54-61页
5.4 本章小结	第61-62页
结论	第62-64页
参考文献	第64-68页
攻读硕士学位期间发表的论文和取得的科研成果	第68-70页
致谢	第70页