首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

区块链关键算法的GPU加速

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-22页
    1.1 研究背景及意义第11-15页
        1.1.1 CPU-GPU异构计算环境第11-13页
        1.1.2 区块链关键算法的研究第13-14页
        1.1.3 研究意义第14-15页
    1.2 国内外研究现状第15-20页
        1.2.1 CUDA访存方式的发展第16-17页
        1.2.2 NVLink优化数据流传输第17-19页
        1.2.3 IBM的CAPI架构第19页
        1.2.4 国内外GPU加速第19-20页
    1.3 主要研究内容第20-21页
    1.4 组织结构第21-22页
第二章 相关技术研究第22-32页
    2.1 CUDA架构的演变第22-25页
        2.1.1 Tesla架构第22页
        2.1.2 Fermi架构第22-23页
        2.1.3 Kepler架构第23-24页
        2.1.4 Maxwell架构第24页
        2.1.5 Pascal架构第24-25页
    2.2 CUDA模型第25-30页
        2.2.1 执行模型第25-27页
        2.2.2 存储模型第27-30页
        2.2.3 流和事件第30页
    2.3 CUDA动态并行第30-31页
    2.4 本章小结第31-32页
第三章 算法并行化实现和数据流的优化第32-54页
    3.1 SHA-256算法并行化的分析第32-35页
        3.1.1 SHA-256算法介绍第32-33页
        3.1.2 SHA-256算法的并行化分析第33-35页
    3.2 KECCAK算法并行化的分析第35-40页
        3.2.1 Keccak算法介绍第35-38页
        3.2.2 Keccak算法的并行化分析第38-40页
    3.3 SHA-256和KECCAK算法在CUDA上的实现第40-43页
        3.3.1 CUDA程序执行框架第40页
        3.3.2 主机端程序设计第40-41页
        3.3.3 设备端程序设计第41-43页
    3.4 数据流的处理模型第43-46页
        3.4.1 数据流概述第43页
        3.4.2 基于GPU数据流处理模型框架第43-46页
    3.5 数据流处理瓶颈分析第46-48页
        3.5.1 数据流传输第46-47页
        3.5.2 数据流的存取第47-48页
        3.5.3 数据流加工过程第48页
    3.6 数据流优化第48-52页
        3.6.1 Hyper-Q优化数据流第48-50页
        3.6.2 纹理内存优化数据流第50-51页
        3.6.3 常量内存优化数据流第51-52页
    3.7 数据依赖性第52-53页
        3.7.1 数据依赖问题第52页
        3.7.2 数据依赖性的解决方式第52-53页
    3.8 本章小结第53-54页
第四章 性能评价第54-60页
    4.1 实验平台和测试性能方法介绍第54页
        4.1.1 实验平台第54页
        4.1.2 测试性能方法第54页
    4.2 实验结果性能分析第54-59页
        4.2.1 CPU-GPU测试第54-57页
        4.2.2 数据流优化测试第57-59页
    4.3 本章小结第59-60页
第五章 总结与展望第60-63页
    5.1 总结第60-61页
    5.2 展望第61-63页
参考文献第63-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:短文本用户评论的分类系统设计与实现
下一篇:内容中心车联网中基于优先级的内容分发和缓存策略研究