首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于CUDA的大规模线性稀疏方程组求解器的设计

摘要第1-7页
ABSTRACT第7-9页
目录第9-11页
第一章 绪论第11-15页
   ·研究背景第11-13页
   ·研究现状第13-14页
   ·本论文结构安排第14-15页
第二章 CUDA 概述第15-31页
   ·引言第15-16页
   ·GPU 硬件架构第16-22页
     ·GPU 芯片架构第16-17页
     ·存储器层次结构第17-20页
     ·全局内存访问第20-22页
   ·CUDA 软件构架第22-27页
     ·计算统一设备架构第22页
     ·内核函数第22-24页
     ·线程结构第24页
     ·执行模型第24-25页
     ·CUDA 编程模型第25-27页
   ·CUDA 程序优化第27-30页
     ·内存优化第27-28页
     ·执行配置优化第28-29页
     ·指令优化第29-30页
   ·小结第30-31页
第三章 稀疏矩阵与线性方程组迭代算法第31-43页
   ·引言第31页
   ·稀疏矩阵存储格式第31-35页
     ·坐标存储法 (Coordinate Storage Scheme)第31-32页
     ·对角存储法 (Diagonal Storage Scheme)第32-33页
     ·Ellpack-Itpack 存储法 (Ellpack-Itpack Storage Scheme)第33页
     ·CSR 存储法 (Compressed Row Storage Scheme)第33-35页
   ·稀疏矩阵分块的实现第35-37页
   ·预条件共轭梯度法第37-41页
     ·共轭梯度法第37-40页
     ·预条件共轭梯度法第40-41页
   ·Kahan 累加求和第41-42页
   ·小结第42-43页
第四章 预条件共轭梯度法的 GPU 移植第43-57页
   ·引言第43页
   ·并行计算的一般设计策略第43-44页
   ·共轭梯度法 GPU 移植第44-54页
     ·稀疏矩阵矢量乘的 GPU 实现第44-50页
     ·矢量内积的 GPU 移植第50-54页
     ·其他操作的 GPU 移植第54页
   ·基于 GPU 实现的方程组求解器算法流程第54-56页
   ·小结第56-57页
第五章 计算结果与分析第57-73页
   ·GPU 实验环境第57-58页
   ·测试数据说明第58-59页
   ·性能测试及分析第59-72页
     ·SpMV 性能测试第59-65页
     ·矢量内积性能测试第65-66页
     ·方程组求解性能测试第66-72页
   ·小结第72-73页
第六章 总结与展望第73-75页
致谢第75-76页
参考文献第76-79页
硕士期间取得的研究成果第79-80页

论文共80页,点击 下载论文
上一篇:基于影像的脑网络组算法与软件平台研究
下一篇:概率疲劳寿命预测方法及可靠性分析