首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

面向稀疏数据的GPU程序优化技术研究

摘要第4-6页
abstract第6-7页
第1章 绪论第10-18页
    1.1 研究背景第10-13页
        1.1.1 稀疏数据与GPU程序优化第10-11页
        1.1.2 深度学习与神经网络第11-13页
    1.2 相关工作第13-16页
        1.2.1 稀疏存储格式与稀疏计算库第13-15页
        1.2.2 深度学习场景中的稀疏优化第15-16页
    1.3 本文主要工作第16-18页
第2章 基于目标代码的GPU程序优化方法第18-37页
    2.1 面向稀疏数据的程序优化思路第18-22页
        2.1.1 立即数替换第18-19页
        2.1.2 稀疏常量优化第19-20页
        2.1.3 基于目标代码的程序优化第20-22页
    2.2 稀疏目标代码生成方法第22-24页
    2.3 稀疏目标代码优化方法第24-35页
        2.3.1 基于PTX的稀疏常量优化算法第24-27页
        2.3.2 基于cubin的稀疏常量优化算法第27-35页
    2.4 本章小结第35-37页
第3章 面向稀疏数据的GPU程序优化框架第37-53页
    3.1 GPU程序优化性能模型第37-40页
        3.1.1 程序优化开销与收益分析第37-38页
        3.1.2 程序优化性能预测第38-40页
    3.2 GPU程序优化框架第40-52页
        3.2.1 基于图模型的GPU程序形式化描述第40-46页
        3.2.2 GPU程序静态优化第46-48页
        3.2.3 GPU程序动态优化第48-52页
    3.3 本章小结第52-53页
第4章 实验与评价第53-72页
    4.1 深度学习场景的应用第53-61页
        4.1.1 LeNet-5网络结构第53-55页
        4.1.2 深度学习训练场景的优化第55-60页
        4.1.3 深度学习预测场景的优化第60-61页
    4.2 性能评价第61-71页
        4.2.1 实验环境说明第61-62页
        4.2.2 基于PTX目标代码的优化第62-66页
        4.2.3 基于cubin目标代码的优化第66-68页
        4.2.4 程序优化框架整体优化性能第68-71页
    4.3 本章小结第71-72页
第5章 总结与展望第72-74页
    5.1 工作总结第72-73页
    5.2 未来展望第73-74页
参考文献第74-79页
作者简介及在学期间所取得的科研成果第79-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:移动自组网通信质量与安全的非合作博弈研究
下一篇:基于地理分布式数据中心的请求调度成本优化算法研究