首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

异构GPU集群的并行编程模型及实现

目录第3-6页
摘要第6-8页
Abstract第8-9页
第一章 绪论第10-16页
    1.1 研究背景第10-12页
    1.2 研究现状第12-14页
    1.3 研究内容第14-15页
    1.4 本文创新点第15页
    1.5 全文组织与安排第15-16页
第二章 异构GPU集群介绍第16-26页
    2.1 传统集群体系结构第16-17页
    2.2 加速器GPU第17-19页
        2.2.1 GPU的特点第17-18页
        2.2.2 GPU的发展第18-19页
    2.3 GPU编程模型第19-25页
        2.3.1 CUDA第20-22页
        2.3.2 OpenCL第22-24页
        2.3.3 OpenACC第24-25页
    2.4 异构GPU集群体系结构第25-26页
第三章 数据流模型第26-37页
    3.1 数据流模型的基本概念第27-28页
    3.2 数据流模型的特点第28-29页
    3.3 流模型分类第29-33页
        3.3.1 同步数据流SDF模型第30页
        3.3.2 循环静态数据流CSDF第30-31页
        3.3.3 布尔数据流BDF第31页
        3.3.4 整形数据流IDF模型第31页
        3.3.5 循环动态数据流CDDF模型第31-32页
        3.3.6 动态数据流DDF第32-33页
    3.4 并行程序设计模型第33-37页
        3.4.1 数据并行模型第34页
        3.4.2 隐式并行模型第34-35页
        3.4.3 消息传递模型第35-36页
        3.4.4 共享变量模型第36-37页
第四章 DISPAR编程模型第37-46页
    4.1 系统模型第39-42页
    4.2 虚拟处理单元第42-43页
    4.3 管道第43页
    4.4 通信原语第43-44页
    4.5 兼容OpenACC第44-46页
第五章 StreamCC预处理系统第46-66页
    5.1 数据结构第46-49页
    5.2 StreamCC的实现的流程框架图第49页
    5.3 StreamCC的核心模块第49-60页
        5.3.1 代码解析模块第49-56页
        5.3.2 进程框架生成模块第56页
        5.3.3 代码生成模块第56-60页
    5.4 Example第60-64页
    5.5 实验结果第64-66页
        5.5.1 代码规模比较第64-65页
        5.5.2 性能比较第65-66页
第六章 总结与展望第66-68页
    6.1 总结第66-67页
    6.2 进一步的工作第67-68页
参考文献第68-70页
读硕士期间公开发表的论文第70-71页
致谢第71-73页

论文共73页,点击 下载论文
上一篇:基于Android系统的地铁导航应用开发
下一篇:32Kb RRAM芯片设计及版图优化