首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

面向GPDSP科学计算的高性能DMA传输方式的设计与实现

摘要第11-12页
ABSTRACT第12页
第一章 绪论第13-25页
    1.1 研究背景第13-22页
        1.1.1 GPDSP处理器概述第14-16页
        1.1.2 HPL介绍第16-17页
        1.1.3 DMA介绍第17-22页
    1.2 论文组织结构第22-25页
        1.2.1 本文内容第22页
        1.2.2 论文组织结构第22-25页
第二章 评测算法分析和DMA设计第25-39页
    2.1 评测算法分析第25-29页
        2.1.1 HPL理论分析第25-27页
        2.1.2 GEMM理论分析第27-29页
    2.2 GPDSP的DMA整体设计第29-38页
        2.2.1 DMA功能概述第29-31页
        2.2.2 DMA整体结构介绍第31-35页
        2.2.3 DMA传输过程介绍第35-38页
    2.3 本章小结第38-39页
第三章 DMA矩阵转置传输第39-57页
    3.1 DMA矩阵转置传输设计需求第39-40页
    3.2 传统矩阵转置传输的实现第40-42页
        3.2.1 传统矩阵转置传输介绍第40页
        3.2.2 传统矩阵转置传输的具体实现方案第40-42页
    3.3 DMA矩阵转置传输设计和实现第42-50页
        3.3.1 传输粒度第42页
        3.3.2 结构和具体实现第42-49页
        3.3.3 模拟验证第49-50页
    3.4 效率提升第50-53页
    3.5 矩阵转置的面积和功耗开销第53-54页
        3.5.1 面积开销第53-54页
        3.5.2 功耗开销第54页
    3.6 本章小结第54-57页
第四章 分段传输与核间同步段传输第57-83页
    4.1 分段传输与核间同步传输的设计背景第57-65页
        4.1.1 基于GEPP-GEBP思想的GEMM实现方案第57-61页
        4.1.2 数据传输速度和存储器分析第61-63页
        4.1.3 分段传输与核间同步传输第63-65页
    4.2 DMA分段传输设计和实现第65-69页
        4.2.1 支持分段传输的硬件结构设计第65-66页
        4.2.2 分段传输的两种结束方式第66-68页
        4.2.3 模拟验证第68-69页
    4.3 效率提升第69-71页
    4.4 分段传输的面积和功耗开销第71页
        4.4.1 面积开销第71页
        4.4.2 功耗开销第71页
    4.5 分段传输的改进第71-76页
        4.5.1 阻塞分段传输的设计和实现第73-75页
        4.5.2 阻塞分段传输的效率提升第75-76页
    4.6 DMA核间同步传输设计与实现第76-79页
        4.6.1 DMA核间同步传输设计第76-77页
        4.6.2 模拟验证第77-79页
    4.7 效率提升第79-80页
    4.8 核间同步传输的面积和功耗开销第80-81页
        4.8.1 面积开销第81页
        4.8.2 功耗开销第81页
    4.9 本章小结第81-83页
第五章 结语第83-85页
    5.1 本文工作总结第83-84页
    5.2 未来工作展望第84-85页
致谢第85-86页
参考文献第86-89页
作者在学期间取得的学术成果第89页

论文共89页,点击 下载论文
上一篇:面向Lustre文件系统的存储系统模拟器的设计与实现
下一篇:矿化纳米纤维和静电纺丝纳米纱线的制备及其在骨组织工程中的应用