求矩阵特征值的GPU并行算法的研究
中文摘要 | 第1-3页 |
Abstract | 第3-8页 |
第1章 绪论 | 第8-16页 |
·高性能并行数值计算的研究背景及意义 | 第8-9页 |
·高性能并行数值计算实现环境的现状 | 第9-12页 |
·集群 | 第9页 |
·多核 | 第9-10页 |
·GPU | 第10-12页 |
·矩阵特征值算法的研究现状 | 第12-13页 |
·目前存在的问题 | 第13页 |
·本文主要研究内容及创新点 | 第13-14页 |
·论文结构安排 | 第14-16页 |
第2章 基础知识 | 第16-20页 |
·矩阵特征值的相关知识 | 第16页 |
·CUDA简介 | 第16-18页 |
·Nsight软件介绍 | 第18页 |
·本章小结 | 第18-20页 |
第3章 基于CUDA的并行Jacobi算法 | 第20-44页 |
·引言 | 第20页 |
·Jacobi迭代法求矩阵特征值的串行算法SA | 第20-23页 |
·并行Jacobi迭代算法PA-1 | 第23-30页 |
·算法前期准备工作 | 第23-24页 |
·并行找出非对角线元素中绝对值最大者 | 第24-28页 |
·并行矩阵更新 | 第28-30页 |
·并行Jacobi迭代算法PA-2 | 第30-35页 |
·概述 | 第30-31页 |
·算法描述 | 第31-35页 |
·混合的并行Jacobi迭代算法HA | 第35页 |
·串行算法与并行算法的时间复杂度分析 | 第35-36页 |
·实验结果与分析 | 第36-42页 |
·本章小结 | 第42-44页 |
第4章 基于CUDA的并行QR算法 | 第44-68页 |
·引言 | 第44-45页 |
·QR方法求解矩阵特征值的串行算法 | 第45-53页 |
·QR方法的基本思想 | 第45-47页 |
·化一般实矩阵为上H矩阵 | 第47-48页 |
·双重步QR方法求矩阵特征值 | 第48-53页 |
·并行算法 | 第53-62页 |
·把一般矩阵转化成上H矩阵的并行算法 | 第54-57页 |
·并行QR算法 | 第57-62页 |
·时间复杂度分析 | 第62-64页 |
·把一般矩阵转化成上H矩阵的时间复杂度分析 | 第62-63页 |
·QR串行算法与QR并行算法时间复杂度分析 | 第63-64页 |
·实验结果与分析 | 第64-67页 |
·本章小结 | 第67-68页 |
结论 | 第68-70页 |
参考文献 | 第70-75页 |
附录A:Nsight辅助编程环境安装与配置 | 第75-80页 |
致谢 | 第80-81页 |
攻读硕士学位期间发表的学术论文 | 第81-82页 |