首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

稀疏线性系统中基于GPU的预条件共轭梯度法并行优化方法的研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-20页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-17页
        1.2.1 基于GPU的数值计算第12-13页
        1.2.2 稀疏矩阵向量乘在高性能计算领域中的研究第13页
        1.2.3 稀疏矩阵向量乘在多核CPU上的研究第13-14页
        1.2.4 稀疏矩阵向量乘在GPU上的研究第14-15页
        1.2.5 稀疏矩阵向量乘在XEON PHI上的研究第15页
        1.2.6 GPU与MIC的属性对比第15-17页
    1.3 研究内容第17-18页
    1.4 本文组织结构第18页
    1.5 本文创新点第18-20页
第二章 相关技术简介第20-25页
    2.1 GPU体系架构第20页
    2.2 XEON PHI体系架构第20页
    2.3 与本文相关技术第20-25页
第三章 基于GPU的稀疏矩阵向量乘算法优化第25-42页
    3.1 稀疏矩阵格式第25-30页
        3.1.1 对角线格式(DIA格式)第25-27页
        3.1.2 并列格式(COO)第27页
        3.1.3 ELLPACK格式(ELL格式)第27-29页
        3.1.4 混合格式(HYB)第29页
        3.1.5 其他格式第29-30页
    3.2 CSR存储格式第30-31页
    3.3 优化策略第31-35页
        3.3.1 基于GPU的稀疏矩阵与向量相乘的KERNEL函数第31-33页
        3.3.2 基于CUDA的稀疏矩阵向量乘的KERNEL函数HALF-WARP优化第33-34页
        3.3.3 数据的传输第34-35页
        3.3.4 其他优化第35页
    3.4 实验分析第35-40页
        3.4.1 数据精度第35页
        3.4.2 优化策略效果第35-37页
        3.4.3 横向比较与分析第37-40页
    3.5 相关工作第40-41页
    3.6 本章总结第41-42页
第四章 基于GPU的预条件共轭梯度算法优化第42-49页
    4.1 算法描述第42-45页
    4.2 实验分析第45-47页
    4.3 相关工作第47-48页
    4.4 本章总结第48-49页
第五章 基于XEON PHI的预条件共轭梯度算法优化第49-59页
    5.1 算法优化第49-54页
        5.1.1 MPI数据传输第52页
        5.1.2 OPENMP并行优化第52-53页
        5.1.3 减少数据依赖第53页
        5.1.4 向量化优化第53页
        5.1.5 计算异步第53-54页
    5.2 实验分析第54-57页
    5.3 相关工作第57页
    5.4 本章总结第57-59页
第六章 结论与展望第59-62页
    6.1 总结第59-61页
        6.1.1 基于GPU的性能优化第59-60页
        6.1.2 基于MIC的性能优化第60-61页
        6.1.3 基于GPU和MIC的对比第61页
    6.2 未来工作第61-62页
参考文献第62-68页
攻读硕士学位期间取得的研究成果第68页
硕士学位期间参与跟论文相关的项目第68-69页
致谢第69-70页
附件第70页

论文共70页,点击 下载论文
上一篇:基于移动设备管理平台的城市管理系统设计与实现
下一篇:基于体可视化的计算机辅助脊柱矫形系统研究