首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

GPU程序的二进制翻译关键技术研究

表目录第7-8页
图目录第8-10页
摘要第10-11页
ABSTRACT第11页
第一章 绪论第12-21页
    1.1 GPU 通用计算概述第12-14页
    1.2 课题研究意义第14-16页
    1.3 国内外研究现状第16-18页
        1.3.1 二进制翻译技术的发展第16-17页
        1.3.2 GPU 代码移植的研究第17-18页
    1.4 论文研究内容第18-19页
    1.5 主要贡献及创新点第19-20页
    1.6 论文结构安排第20-21页
第二章 CUDA 异构并行计算架构第21-28页
    2.1 异构并行计算架构第21-23页
    2.2 CUDA 概述第23-27页
        2.2.1 CUDA 编程模型第23-24页
        2.2.2 CUDA 编译流程第24-26页
        2.2.3 CUDA 执行模型第26-27页
    2.3 本章小结第27-28页
第三章 GPU 程序的二进制翻译关键技术第28-47页
    3.1 异构平台的二进制翻译系统框架设计第28-31页
        3.1.1 传统静态二进制翻译技术第28页
        3.1.2 CUDA 程序的静态二进制翻译系统框架第28-31页
        3.1.3 小结第31页
    3.2 层次化的线程映射模型研究第31-35页
        3.2.1 问题及分析第31-32页
        3.2.2 GPU 线程层次第32-33页
        3.2.3 线程映射方法第33-34页
        3.2.4 层次化的线程映射模型第34-35页
        3.2.5 小结第35页
    3.3 基于线程循环结构的强制同步算法研究第35-41页
        3.3.1 问题及分析第35-36页
        3.3.2 线程循环结构第36-37页
        3.3.3 强制同步算法第37-38页
        3.3.4 重构 PTX 指令流第38-40页
        3.3.5 强制同步对控制流的影响第40页
        3.3.6 小结第40-41页
    3.4 多层次存储器的存储器映射模型研究第41-46页
        3.4.1 问题及分析第41页
        3.4.2 多层次存储器的映射原则第41-42页
        3.4.3 GPU 存储器结构第42-44页
        3.4.4 目标平台存储器结构第44-45页
        3.4.5 GPU 到目标平台的存储器映射第45-46页
        3.4.6 小结第46页
    3.5 本章小结第46-47页
第四章 原型系统 GPUtoM 的设计与实现第47-65页
    4.1 PTX 代码提取第47-50页
        4.1.1 用动态拦截方法提取 PTX 代码第48页
        4.1.2 用静态分析方法提取 PTX 代码第48页
        4.1.3 用第三方工具获取 PTX 代码第48-49页
        4.1.4 PTX 代码提取第49-50页
    4.2 PTX 语法解析器第50-51页
    4.3 指令翻译第51-57页
        4.3.1 特殊寄存器处理第51-54页
        4.3.2 普通指令翻译第54-55页
        4.3.3 断言指令翻译第55-57页
    4.4 线性扫描寄存器分配第57-64页
        4.4.1 不完全 SSA 转化第57-59页
        4.4.2 创建变量生命域第59-62页
        4.4.3 线性扫描寄存器分配第62-64页
        4.4.4 寄存器替换第64页
    4.5 本章小结第64-65页
第五章 实验验证及分析第65-70页
    5.1 实验验证准备第65-67页
        5.1.1 测试验证平台第65页
        5.1.2 测试用例第65-66页
        5.1.3 测试方法第66-67页
    5.2 实验及分析第67-69页
        5.2.1 强制同步算法测试第67-68页
        5.2.2 功能测试第68页
        5.2.3 性能测试第68-69页
    5.3 本章小结第69-70页
结束语第70-72页
附录一 强制同步算法第72-73页
附录二 线性扫描寄存器分配算法第73-75页
附录三 寄存器替换算法第75-76页
参考文献第76-80页
作者简历 攻读硕士学位期间完成的主要工作第80-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:基于图像特征的鲁棒数字水印技术研究
下一篇:基于DM6446的音频信号识别系统的研究