首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

面向异构体系结构的任务流化技术研究

目录第4-7页
表目录第7-8页
图目录第8-11页
摘要第11-13页
ABSTRACT第13-14页
第一章 绪论第16-29页
    1.1 引言第16-17页
    1.2 课题研究背景第17-26页
        1.2.1 高性能计算系统体系结构演变历程第17-19页
        1.2.2 典型异构计算加速部件及其对比分析第19-23页
        1.2.3 典型异构高性能计算系统概述第23-26页
    1.3 异构高性能计算技术面临的问题第26-27页
    1.4 本文的主要工作与创新第27-28页
    1.5 论文结构第28-29页
第二章 面向异构体系结构的任务流模型第29-43页
    2.1 引言第29页
    2.2 相关研究第29-34页
    2.3 任务流模型及相关概念第34-38页
        2.3.1 任务流处理思想第34-35页
        2.3.2 异构体系结构抽象模型第35-36页
        2.3.3 任务流模型第36-38页
    2.4 实例分析第38-42页
        2.4.1 实例简介第38-39页
        2.4.2 计算特征分析第39-42页
    2.5 小结第42-43页
第三章 异构计算部件计算特性研究第43-69页
    3.1 引言第43页
    3.2 GPU 并行开销评估方法研究第43-54页
        3.2.1 GPU 硬件结构与 CUDA 编程模型第44-48页
        3.2.2 相关研究第48-49页
        3.2.3 GPU 并行开销模型(GCM,GPU parallel Cost Model)第49-52页
        3.2.4 实验与分析第52-54页
    3.3 FPGA 并行开销评估方法研究第54-68页
        3.3.1 FPGA 硬件结构及设计方法第55-56页
        3.3.2 相关研究第56-57页
        3.3.3 嵌套循环设计空间设计方法第57-63页
        3.3.4 FPGA 并行开销模型(FCM,FPGA parallel Cost Model)第63-64页
        3.3.5 实验与分析第64-68页
    3.4 小结第68-69页
第四章 任务划分与任务流化第69-77页
    4.1 引言第69页
    4.2 相关研究第69-70页
    4.3 任务划分第70-71页
    4.4 任务流化第71-76页
        4.4.1 具有控制依赖关系的任务流化方法第72-74页
        4.4.2 具有数据依赖关系的任务流化方法第74-76页
    4.5 小结第76-77页
第五章 任务粒度调整策略及任务映射方法第77-93页
    5.1 引言第77-78页
    5.2 计算节点间任务粒度调整策略与任务映射方法第78-86页
        5.2.1 相关研究第78-80页
        5.2.2 基于任务流图均衡划分的任务粒度调整方法第80-84页
        5.2.3 实验与分析第84-86页
    5.3 计算节点内任务粒度调整策略与映射方法第86-92页
        5.3.1 相关研究第87-88页
        5.3.2 基于计算部件性能评估的任务粒度调整与映射方法第88-90页
        5.3.3 实验与分析第90-92页
    5.4 小结第92-93页
第六章 基于 TFM 模型的任务流化工具第93-109页
    6.1 引言第93-95页
    6.2 应用程序执行特征抽取第95-96页
        6.2.1 代码预处理第95页
        6.2.2 生成初始化 TFG第95页
        6.2.3 并行性分析第95-96页
    6.3 异构计算部件计算特性抽取第96-99页
        6.3.1 系统级模板第97页
        6.3.2 节点级模板第97页
        6.3.3 器件级模板第97-98页
        6.3.4 功能单元级模板第98-99页
    6.4 映射过程第99-104页
        6.4.1 循环优化第100-101页
        6.4.2 开销测试第101-103页
        6.4.3 调整 TFG、任务类型标记和并行计算开销评估第103-104页
        6.4.4 生成 TFG 执行方案第104页
    6.5 实验与分析第104-108页
        6.5.1 实验环境及测试用例第104页
        6.5.2 实验结果第104-108页
        6.5.3 实验分析第108页
    6.6 小结第108-109页
结束语第109-112页
参考文献第112-122页
作者简历 攻读博士学位期间完成的主要工作第122-124页
致谢第124页

论文共124页,点击 下载论文
上一篇:高速串模式匹配算法研究
下一篇:基于纯转动Raman激光雷达系统的大气温度和气溶胶的探测及测风边缘技术的性能比较