首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

面向千万亿次CPU-GPU异构系统的编程模型与性能优化关键技术研究

摘要第10-12页
ABSTRACT第12-14页
第一章 绪论第15-39页
    1.1 研究背景第16-24页
        1.1.1 GPU与异构系统第17-20页
        1.1.2 大规模CPU-GPU异构系统面临的技术挑战第20-24页
    1.2 相关工作第24-34页
        1.2.1 GPU编程、优化方法和性能模型第24-30页
        1.2.2 CPU-GPU异构系统编程和优化方法第30-31页
        1.2.3 典型千万亿次异构系统体系结构和并行软件支持第31-34页
    1.3 研究内容第34-36页
    1.4 主要创新第36-37页
    1.5 论文组织第37-39页
第二章 千万亿次CPU-GPU异构系统并行编程模型研究第39-53页
    2.1 千万亿次系统MPI/Open MP/Streaming混合编程模型第39-40页
    2.2 混合编程模型的任务映射第40-46页
        2.2.1 结点为中心的任务映射第42页
        2.2.2 CPU为中心的任务映射第42-44页
        2.2.3 GPU为中心的任务映射第44-45页
        2.2.4 任务映射方法总结第45页
        2.2.5 实验第45-46页
    2.3 基于共享内存的多进程共享GPU技术第46-51页
        2.3.1 实现原理第47-48页
        2.3.2 实现方法第48-50页
        2.3.3 实验第50-51页
    2.4 本章小结第51-53页
第三章 从千万亿次扩展到百万万亿次编程模型分析第53-69页
    3.1 未来E级系统的发展趋势第53-55页
    3.2 结点间MPI编程和全系统MPI+X混合编程模型分析第55-57页
    3.3 结点内编程模型的需求第57-58页
    3.4 结点内编程模型分析与总结第58-67页
        3.4.1 消息传递第58-59页
        3.4.2 共享存储第59-61页
        3.4.3 单边访问第61-62页
        3.4.4 分布数组第62-64页
        3.4.5 异构模型第64-66页
        3.4.6 国内的研究工作第66-67页
        3.4.7 特征总结第67页
    3.5 本章小结第67-69页
第四章 基于测量的自适应任务划分第69-83页
    4.1 异构计算平台任务划分问题的提出第69-72页
        4.1.1 异构平台科学计算任务平衡划分的重要性第70-71页
        4.1.2 异构平台科学计算任务平衡划分的难点第71-72页
    4.2 基于测量的自适应任务划分第72-77页
        4.2.1 任务划分比率初值设定第73-74页
        4.2.2 划分任务第74页
        4.2.3 更新任务比例数据库第74-75页
        4.2.4 基于测量的自适应任务划分示例分析:矩阵乘第75-77页
    4.3 实验与讨论第77-81页
        4.3.1 GPU/CPU及各CPU核间任务划分比例调整第78-79页
        4.3.2 优化前后性能对比第79页
        4.3.3 多结点实验测试第79-81页
    4.4 本章小结第81-83页
第五章 嵌套双缓冲软件流水技术第83-93页
    5.1 软件流水的提出第83-86页
        5.1.1 CPU与GPU的单边数据通信模型第83-85页
        5.1.2 GPU程序代价模型第85页
        5.1.3 传统双缓冲软件流水执行模型和代价模型第85-86页
        5.1.4 传统方法的不足第86页
    5.2 嵌套双缓冲软件流水第86-89页
        5.2.1 执行模型和代价模型第86-87页
        5.2.2 基于有限状态自动机的高效实现第87-89页
    5.3 Cache旁路的流式数据拷贝优化第89-90页
    5.4 基于天河 -1 平台评测第90-91页
    5.5 本章小结第91-93页
第六章 千万亿次CPU-GPU异构系统LINPACK实现与优化第93-111页
    6.1 千万亿次CPU-GPU异构系统第93-95页
        6.1.1 天河 -1第93-95页
        6.1.2 天河 -1A第95页
    6.2 LINPACK编程第95-100页
        6.2.1 LINPACK算法实现第96-97页
        6.2.2 异构系统LINPACK实现第97-99页
        6.2.3 MPI/Open MP/Streaming编程模型实现第99-100页
    6.3 优化方法第100-103页
        6.3.1 自适应任务划分和嵌套双缓冲软件流水第100页
        6.3.2 MPI/Open MP混合编程方式下SWAP算法优化第100-102页
        6.3.3 结点间GPU空间传输零拷贝和通信优化技术第102页
        6.3.4 传统的通用优化方法第102-103页
    6.4 实验第103-108页
        6.4.1 单进程测试第103-104页
        6.4.2 多进程测试第104-108页
    6.5 本章小结第108-111页
第七章 结论与展望第111-113页
    7.1 论文工作总结第111-112页
    7.2 课题研究展望第112-113页
致谢第113-115页
参考文献第115-129页
作者在学期间取得的学术成果第129-131页

论文共131页,点击 下载论文
上一篇:基于单目图像序列光流的三维重建关键技术研究
下一篇:ISAR运动补偿和成像新方法的研究