首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

面向众核协处理器的高效能GPGPU片上网络研究

摘要第9-11页
ABSTRACT第11-12页
第一章 绪论第13-32页
    1.1 研究背景第13-19页
        1.1.1 多核/众核时代第13-15页
        1.1.2 片上通信技术第15-17页
        1.1.3 GPGPU片上网络研究面临的挑战第17-19页
    1.2 国内外研究现状第19-27页
        1.2.1 多核/众核处理器体系结构的发展第19-24页
        1.2.2 片上网络的研究现状第24-27页
    1.3 选题依据第27-28页
    1.4 研究内容第28-32页
        1.4.1 主要工作第28-29页
        1.4.2 研究方法第29-30页
        1.4.3 论文结构第30-32页
第二章 GPGPU体系结构与实验平台第32-49页
    2.1 NVIDIA统一架构GPU第32-39页
    2.2 CUDA开发平台第39-42页
        2.2.1 CUDA执行模式和线程组织第40-41页
        2.2.2 CUDA存储层次第41-42页
    2.3 GPGPU-Sim介绍第42-47页
        2.3.1 整体结构和模拟流程第42-44页
        2.3.2 功能仿真第44-45页
        2.3.3 性能模拟第45-46页
        2.3.4 功耗统计第46-47页
    2.4 本章小结第47-49页
第三章 低开销访存调度策略设计第49-58页
    3.1 No C仲裁机制设计第49-54页
        3.1.1 研究动机第49-50页
        3.1.2 Row Access Locality分析第50-51页
        3.1.3 Same Source First仲裁机制设计第51-54页
    3.2 访存调度策略设计第54-57页
        3.2.1 研究动机第54-55页
        3.2.2 Batched-FIFO访存调度策略设计第55-56页
        3.2.3 拓扑结构和路由算法选择第56-57页
    3.3 本章小结第57-58页
第四章 高性能片上网络优化第58-67页
    4.1 虚通道划分机制第58-61页
        4.1.1 研究背景介绍第58-59页
        4.1.2 基于目标节点的静态虚通道划分机制设计第59-61页
    4.2 片上路由微体系结构第61-65页
        4.2.1 研究背景介绍第61-63页
        4.2.2 多端口片上路由微体系结构设计第63-65页
    4.3 本章小结第65-67页
第五章 高效能GPGPU片上网络——RLA No C第67-92页
    5.1 RLA No C结构框架第67-69页
    5.2 实验环境介绍第69-71页
    5.3 性能测试与分析第71-91页
        5.3.1 测试集特征分析第72-73页
        5.3.2 低开销访存调度策略第73-79页
        5.3.3 高性能优化设计第79-85页
        5.3.4 与基于FR-FCFS策略的No C对比分析第85-91页
    5.4 本章小结第91-92页
第六章 结束语第92-95页
    6.1 工作总结第92-93页
    6.2 研究展望第93-95页
致谢第95-97页
参考文献第97-106页
作者在学期间取得的学术成果第106页

论文共106页,点击 下载论文
上一篇:星载简缩极化SAR舰船目标检测方法研究
下一篇:格子玻尔兹曼方法的众核平台并行计算与优化研究