首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

神威·太湖之光上数据流编程模型的设计与实现

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第14-24页
    1.1 研究背景第14-21页
        1.1.1 神威·太湖之光第14-18页
        1.1.2 传统编程模型在神威·太湖之光上面临的挑战第18-19页
        1.1.3 数据流模型第19-21页
    1.2 论文研究目标和主要工作第21-22页
    1.3 论文结构第22-24页
第2章 相关研究工作第24-34页
    2.1 现有的若干基于数据流的编程模型第24-27页
        2.1.1 SWARM第24-25页
        2.1.2 Charm++第25-26页
        2.1.3 TensorFlow第26-27页
    2.2 Codelet程序执行模型第27-30页
        2.2.1 基本单元第27-28页
        2.2.2 激发规则第28页
        2.2.3 Codelet Graph第28页
        2.2.4 Threaded Procedure第28-29页
        2.2.5 抽象机器模型第29-30页
    2.3 DARTS运行时系统第30-33页
        2.3.1 运行时系统的实现第30-32页
        2.3.2 实例研究第32-33页
    2.4 本章小结第33-34页
第3章 SunwayFlow:神威·太湖之光上的一种数据流编程模型第34-44页
    3.1 机器模型的抽象第34-37页
        3.1.1 单核组单SU方案第34-35页
        3.1.2 单核组多SU方案第35-36页
        3.1.3 本文采取的映射方案第36-37页
    3.2 程序执行模型的设计第37-39页
        3.2.1 去除TP结构第37-38页
        3.2.2 预激发状态第38-39页
    3.3 编程接口第39-43页
        3.3.1 Runtime类第40页
        3.3.2 SchedulingUint类第40-41页
        3.3.3 ComputeUnit类第41页
        3.3.4 Codelet类第41页
        3.3.5 本节小结第41-43页
    3.4 本章小结第43-44页
第4章 SunwayFlow运行时系统的设计与实现第44-54页
    4.1 运行机制第44-48页
        4.1.1 Codelet状态转换第44-45页
        4.1.2 SU和CU的协作模式第45页
        4.1.3 CU运行机制第45-47页
        4.1.4 数据移动第47-48页
    4.2 关键技术第48-53页
        4.2.1 状态变量倍增第48-49页
        4.2.2 ID池第49-50页
        4.2.3 就绪codelet队列第50页
        4.2.4 任务分配与执行第50-51页
        4.2.5 资源释放与调度管理第51-52页
        4.2.6 SU优先模式第52页
        4.2.7 虚拟CU模式第52-53页
    4.3 本章小结第53-54页
第5章 实例研究第54-68页
    5.1 HPCG概述第54-56页
    5.2 强数据依赖的核心计算函数优化第56-61页
        5.2.1 SymGS算法简述第57页
        5.2.2 Multi-coloring方法第57-58页
        5.2.3 数据流优化方法第58-60页
        5.2.4 实验结果分析第60-61页
    5.3 无数据依赖的核心计算函数优化第61-63页
        5.3.1 SPMV优化第62-63页
        5.3.2 DDOT和WAXPBY优化第63页
    5.4 HPCG整体性能测试分析第63-66页
        5.4.1 串行版本性能测试分析第63-64页
        5.4.2 MPI版本性能测试分析第64-65页
        5.4.3 本节小结第65-66页
    5.5 本章小结第66-68页
第6章 全文总结第68-72页
    6.1 研究工作总结第68-69页
    6.2 主要创新点第69-70页
    6.3 未来工作展望第70-72页
参考文献第72-75页
致谢第75-76页
在读期间发表的学术论文与取得的研究成果第76-77页
在读期间参与的科研项目第77页

论文共77页,点击 下载论文
上一篇:HPCG在多核/众核平台上的实现与优化
下一篇:面向回填优化的vasp作此执行时间预测的研究