求矩阵特征值的GPU并行算法的研究
| 中文摘要 | 第1-3页 |
| Abstract | 第3-8页 |
| 第1章 绪论 | 第8-16页 |
| ·高性能并行数值计算的研究背景及意义 | 第8-9页 |
| ·高性能并行数值计算实现环境的现状 | 第9-12页 |
| ·集群 | 第9页 |
| ·多核 | 第9-10页 |
| ·GPU | 第10-12页 |
| ·矩阵特征值算法的研究现状 | 第12-13页 |
| ·目前存在的问题 | 第13页 |
| ·本文主要研究内容及创新点 | 第13-14页 |
| ·论文结构安排 | 第14-16页 |
| 第2章 基础知识 | 第16-20页 |
| ·矩阵特征值的相关知识 | 第16页 |
| ·CUDA简介 | 第16-18页 |
| ·Nsight软件介绍 | 第18页 |
| ·本章小结 | 第18-20页 |
| 第3章 基于CUDA的并行Jacobi算法 | 第20-44页 |
| ·引言 | 第20页 |
| ·Jacobi迭代法求矩阵特征值的串行算法SA | 第20-23页 |
| ·并行Jacobi迭代算法PA-1 | 第23-30页 |
| ·算法前期准备工作 | 第23-24页 |
| ·并行找出非对角线元素中绝对值最大者 | 第24-28页 |
| ·并行矩阵更新 | 第28-30页 |
| ·并行Jacobi迭代算法PA-2 | 第30-35页 |
| ·概述 | 第30-31页 |
| ·算法描述 | 第31-35页 |
| ·混合的并行Jacobi迭代算法HA | 第35页 |
| ·串行算法与并行算法的时间复杂度分析 | 第35-36页 |
| ·实验结果与分析 | 第36-42页 |
| ·本章小结 | 第42-44页 |
| 第4章 基于CUDA的并行QR算法 | 第44-68页 |
| ·引言 | 第44-45页 |
| ·QR方法求解矩阵特征值的串行算法 | 第45-53页 |
| ·QR方法的基本思想 | 第45-47页 |
| ·化一般实矩阵为上H矩阵 | 第47-48页 |
| ·双重步QR方法求矩阵特征值 | 第48-53页 |
| ·并行算法 | 第53-62页 |
| ·把一般矩阵转化成上H矩阵的并行算法 | 第54-57页 |
| ·并行QR算法 | 第57-62页 |
| ·时间复杂度分析 | 第62-64页 |
| ·把一般矩阵转化成上H矩阵的时间复杂度分析 | 第62-63页 |
| ·QR串行算法与QR并行算法时间复杂度分析 | 第63-64页 |
| ·实验结果与分析 | 第64-67页 |
| ·本章小结 | 第67-68页 |
| 结论 | 第68-70页 |
| 参考文献 | 第70-75页 |
| 附录A:Nsight辅助编程环境安装与配置 | 第75-80页 |
| 致谢 | 第80-81页 |
| 攻读硕士学位期间发表的学术论文 | 第81-82页 |