首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

GPU体系结构模拟器的实现与优化

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-14页
    1.1 GPU模拟器技术概述第10-11页
    1.2 国内外研究现状第11-12页
    1.3 本文的主要工作和结构安排第12-14页
第二章 Z-GPU-SIMULATOR模拟器系统简介第14-18页
    2.1 项目背景和设计目标第14-15页
    2.2 体系结构第15-18页
第三章 简易调试器第18-32页
    3.1 基本功能第18-23页
        3.1.1 功能需求第18-19页
        3.1.2 寄存器结构体的设计与实现第19-21页
        3.1.3 接口的设计与实现第21页
        3.1.4 对内存和寄存器扫描进行测试第21-23页
    3.2 表达式求值第23-27页
        3.2.1 功能需求第23页
        3.2.2 词法分析的设计与实现第23-26页
        3.2.3 对词法分析进行测试第26页
        3.2.4 递归求值的设计与实现第26-27页
    3.3 复杂表达式求值第27-30页
        3.3.1 功能需求第27页
        3.3.2 支持负数和地址解引用的设计与实现第27页
        3.3.3 主运算元识别算法的设计与实现第27-29页
        3.3.4 对复杂表达式求值的测试第29-30页
    3.4 WATCHPOINT(监视点)的设计与实现第30-31页
    3.5 本章小结第31-32页
第四章 内存模块第32-40页
    4.1 内存模块的模拟第32-37页
        4.1.1 内存模块的技术现状第32-34页
        4.1.2 内存模块的功能需求第34页
        4.1.3 内存模块的设计与实现第34-37页
        4.1.4 内存模块的初始化第37页
    4.2 内存模块的读写第37-39页
        4.2.1 生成动态链接库第37-38页
        4.2.2 对内存模块进行测试第38-39页
    4.3 本章小结第39-40页
第五章 片上网络第40-45页
    5.1 片上网络的模拟第40-42页
        5.1.1 对现有片上网络模拟器的分析第40-41页
        5.1.2 片上网络模块的功能需求第41页
        5.1.3 片上网络模块设计与实现第41-42页
    5.2 片上网络的构建第42-44页
        5.2.1 片上网络的初始化第42-43页
        5.2.2 生成动态链接库第43-44页
        5.2.3 测试第44页
    5.3 本章小结第44-45页
第六章 调度策略的设计第45-62页
    6.1 GPU内CORE之间的存储层次结构第45-46页
    6.2 对P-NUMA设计的讨论第46-52页
    6.3 简要介绍CUDA编程模式第52-58页
    6.4 基于WARP-LEVEL的调度策略第58-61页
    6.5 本章小结第61-62页
第七章 系统集成与测试第62-70页
    7.1 测试数据第62页
    7.2 测试结果第62-64页
    7.3 对测试结果进行分析第64-70页
第八章 总结与展望第70-73页
    8.1 本文主要工作及结论第70页
    8.2 后续工作及展望第70-73页
参考文献第73-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:SIMD非对齐访存结构的设计与实现
下一篇:基于MPC8280处理平台的软件容错与快速恢复设计