首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于GPU的矩阵乘法优化研究

摘要第8-10页
ABSTRACT第10-11页
第1章 绪论第12-19页
    1.1 研究背景第12-14页
        1.1.1 传统单核结构面临瓶颈第12页
        1.1.2 众核GPU通用计算走向成熟第12-14页
    1.2 并行算法基础及应用第14-16页
        1.2.1 并行算法基础第14页
        1.2.2 并行应用的发展第14-16页
    1.3 研究动机第16页
        1.3.1 GPU架构上性能优化的难点第16页
    1.4 本文的贡献第16-17页
    1.5 论文的组织第17-19页
第2章 实验平台第19-25页
    2.1 众核GPU硬件结构第19-25页
        2.1.1 CUDA并行计算平台第22-23页
        2.1.2 CUDA编程环境下算法优化原则第23-25页
第3章 适应GPU结构特征的优化策略研究第25-29页
    3.1 单个线程优化工作第25-26页
    3.2 多线程优化工作第26-27页
    3.3 适应众核结构的数据重用方法研究第27-29页
第4章 适应GPU平台的GEMV优化算法第29-50页
    4.1 现有GPU平台上GEMV算法分析第30-33页
    4.2 WARP_BLOCK(1X)算法描述第33-35页
    4.3 WARP_BLOCK(2X)算法描述第35-38页
    4.4 实验结果与分析第38-43页
    4.5 分块大小对WARP_BLOCK(2X)算法性能影响探究第43-48页
    4.6 本章小结第48-50页
第5章 稀疏矩阵向量乘法性能优化第50-78页
    5.1 稀疏矩阵向量乘法的优化意义第50页
    5.2 稀疏矩阵简介第50-59页
        5.2.1 稀疏矩阵存储格式第51-58页
        5.2.2 稀疏矩阵集第58-59页
    5.3 相关研究工作第59-62页
        5.3.1 优化稀疏矩阵向量乘法的难点第60-61页
        5.3.2 研究热点与趋势第61-62页
    5.4 一种新型存储格式HYB-I第62-70页
        5.4.1 HYB格式存在的问题第62-63页
        5.4.2 HYB-I格式第63-64页
        5.4.3 基于HYB-I格式的算法第64-65页
        5.4.4 相关参数确定第65-66页
        5.4.5 实验结果与分析第66-70页
    5.5 高速缓存分块算法第70-78页
        5.5.1 BCSR格式第71-73页
        5.5.2 基于BCSR格式的SpMV算法第73页
        5.5.3 实验结果与分析第73-75页
        5.5.4 本章小结第75-78页
第6章 总结与展望第78-81页
    6.1 本章小结第78-79页
    6.2 研究展望第79-81页
参考文献第81-86页
致谢第86-87页
攻读博士学位期间发表的学术论文目录第87-88页
攻读博士学位期间参与科研项目情况第88-89页
外文论文第89-122页
学位论文评阅及答辩情况表第122页

论文共122页,点击 下载论文
上一篇:机构养老方式下的西安市老年人居住空间设计研究
下一篇:起重机安全警示器的研究与设计