首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--其他计算机论文

GPU加速的矩阵计算的研究

中文摘要第3-4页
Abstract第4-5页
第1章 绪论第9-15页
    1.1 高性能矩阵计算的背景第9-10页
    1.2 高性能并行计算的研究现状第10-11页
        1.2.1 高性能计算的研究现状第10-11页
        1.2.2 并行计算机的研究现状第11页
    1.3 矩阵计算的研究现状及问题第11-13页
        1.3.1 正矩阵特征值的研究现状第12页
        1.3.2 一般矩阵特征值的研究现状第12页
        1.3.3 矩阵求逆的研究现状第12-13页
        1.3.4 存在的问题第13页
    1.4 本文研究内容及创新点第13-14页
    1.5 论文结构安排第14-15页
第2章 基础知识第15-22页
    2.1 矩阵特征值基础知识第15页
    2.2 矩阵逆的基础知识第15页
    2.3 GPU第15-17页
    2.4 CUDA第17-20页
        2.4.1 CUDA体系结构第17-18页
        2.4.2 CUDA存储结构第18-19页
        2.4.3 CUDA编程模型第19-20页
    2.5 Nsight软件介绍第20-21页
    2.6 本章小结第21-22页
第3章 基于CUDA的相似变换求解正矩阵最大特征值第22-36页
    3.1 引言第22-23页
    3.2 相似变换串行算法求解正矩阵的最大特征值第23-26页
        3.2.1 数学基础第23页
        3.2.2 串行算法基本思想第23-25页
        3.2.3 实例解析第25-26页
    3.3 CUDA实现第26-30页
    3.4 CUDA优化第30-31页
        3.4.1 内存分配优化第30-31页
        3.4.2 存储器访问优化第31页
    3.5 时间复杂度第31-33页
        3.5.1 串行算法时间复杂度第31-32页
        3.5.2 并行算法时间复杂度第32-33页
    3.6 实验结果与分析第33-35页
    3.7 本章小结第35-36页
第4章 基于CUDA的求解一般矩阵近似最大特征值第36-49页
    4.1 引言第36-37页
    4.2 串行算法求解一般矩阵近似最大特征值第37-39页
        4.2.1 数学基础第37页
        4.2.2 串行算法基本思想第37-38页
        4.2.3 实例解析第38-39页
    4.3 CUDA实现第39-44页
    4.4 时间复杂度分析第44-45页
        4.4.1 串行算法时间复杂度第44页
        4.4.2 并行算法时间复杂度第44-45页
    4.5 实验结果与分析第45-48页
    4.6 本章小结第48-49页
第5章 基于CUDA的全选主元高斯约旦法求解逆矩阵第49-64页
    5.1 引言第49-50页
    5.2 全选主元高斯约旦法求逆矩阵的串行算法第50-52页
        5.2.1 实数矩阵的全选主元高斯约旦算法第50-51页
        5.2.2 复数矩阵的全选主元高斯约旦算法第51-52页
    5.3 CUDA实现第52-58页
        5.3.1 CUDA实现的实数矩阵的全选主元高斯约旦算法第52-55页
        5.3.2 CUDA实现的复数矩阵的全选主元高斯约旦算法第55-58页
    5.4 时间复杂度分析第58-59页
        5.4.1 串行算法时间复杂度第58-59页
        5.4.2 并行算法时间复杂度第59页
    5.5 实验结果与分析第59-63页
    5.6 本章小结第63-64页
结论第64-65页
参考文献第65-71页
致谢第71-72页
攻读硕士学位期间发表的学术论文第72页

论文共72页,点击 下载论文
上一篇:Hs-cTnT和H-FABP在慢阻肺急性加重期心脏功能早期损害中的临床意义
下一篇:HLA-G基因与移植免疫耐受实验性研究