首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

高性能低能耗GPGPU计算技术研究

摘要第6-8页
ABSTRACT第8-10页
缩略语第18-19页
第一章 绪论第19-33页
    1.1 GPU高性能计算简介第19-23页
        1.1.1 GPU高性能计算研究分类第21-23页
    1.2 GPU高性能计算软硬件平台介绍第23-25页
        1.2.1 GPU硬件体系结构第23-24页
        1.2.2 GPU编程模型及软件开发平台第24-25页
    1.3 研究内容和创新点第25-27页
    1.4 国内外研究现状第27-31页
        1.4.1 高能效GPU新架构研究第27-28页
        1.4.2 GPU上的不规则应用及负载均衡研究第28-29页
        1.4.3 GPU上的图算法及图处理系统研究第29-31页
    1.5 论文的组织和结构第31-33页
第二章 高能效GPU处理器架构Buddy SM第33-57页
    2.1 研究背景及简介第33-35页
    2.2 GPU前端介绍第35-37页
        2.2.1 前端的构成第35-37页
        2.2.2 指令发射机制第37页
    2.3 Buddy SM架构第37-45页
        2.3.1 架构总览第37-38页
        2.3.2 指令发射第38-39页
        2.3.3 统一线程块分配第39页
        2.3.4 建立共享第39-40页
        2.3.5 解除共享第40-42页
        2.3.6 重建共享第42页
        2.3.7 共享群的通信第42-44页
        2.3.8 自适应共享群第44-45页
    2.4 实验方法第45-50页
        2.4.1 模拟器配置第45-46页
        2.4.2 功率和面积的开销第46-47页
        2.4.3 测试集第47-50页
    2.5 实验结果和分析第50-55页
        2.5.1 共享时间百分比第50-51页
        2.5.2 重建共享策略的比较第51页
        2.5.3 自适应共享群方法的性能评估第51-52页
        2.5.4 Buddy SM的影响第52-53页
        2.5.5 性能比较第53-54页
        2.5.6 前端的节能第54-55页
        2.5.7 整个GPU的节能第55页
    2.6 本章小结第55-57页
第三章 高性能GPU系统软件CUIRRE第57-85页
    3.1 研究背景及简介第57-58页
    3.2 不规则循环和线程级负载不均衡第58-61页
        3.2.1 不规则应用的特征化第59-60页
        3.2.2 GPU资源利用率第60-61页
    3.3 线程级负载均衡的任务池方法第61-66页
        3.3.1 任务池方法简介第61-62页
        3.3.2 任务池方法的GPU实现第62-63页
        3.3.3 自适应负载因子方法第63-66页
    3.4 CUIRRE库第66-71页
        3.4.1 负载均衡模块第67-68页
        3.4.2 诊断模块第68-70页
        3.4.3 特征化模块第70页
        3.4.4 CUIRRE库的应用第70-71页
    3.5 应用集第71-74页
        3.5.1 测试应用第72页
        3.5.2 真实应用第72-74页
    3.6 实验方法第74-77页
        3.6.1 硬软件配置第74-75页
        3.6.2 其它负载均衡方法第75-76页
        3.6.3 测试过程第76页
        3.6.4 性能指标第76页
        3.6.5 开销测量第76-77页
    3.7 实验结果及分析第77-84页
        3.7.1 应用的特征化第77-79页
        3.7.2 负载均衡方法性能比较第79-81页
        3.7.3 自适应负载因子方法的性能评估第81-84页
    3.8 本章小结第84-85页
第四章 高性能GPU应用GGraph第85-103页
    4.1 研究背景及简介第85-87页
    4.2 CPU和GPU异构系统上的图处理第87-90页
        4.2.1 图算法第87-88页
        4.2.2 图的表示第88页
        4.2.3 计算模型第88-89页
        4.2.4 磁盘的I/O特性第89-90页
    4.3 GGraph平台的架构第90-95页
        4.3.1 图数据的存储第90-91页
        4.3.2 读写模块第91-92页
        4.3.3 分图模块第92-94页
        4.3.4 消息管理模块第94页
        4.3.5 内存管理模块第94-95页
    4.4 实验方法第95-98页
        4.4.1 图算法第95-96页
        4.4.2 软件和实验配置第96页
        4.4.3 硬件平台第96-97页
        4.4.4 测试图数据集第97页
        4.4.5 性能指标第97-98页
    4.5 实验结果及分析第98-101页
        4.5.1 自适应负载均衡方法的评测第98-99页
        4.5.2 可扩展性评测第99页
        4.5.3 所有平台的性能比较第99-100页
        4.5.4 运行不同算法的性能比较第100页
        4.5.5 所有平台的能效比较第100-101页
    4.6 本章小结第101-103页
第五章 总结与展望第103-105页
    5.1 本文工作总结第103-104页
    5.2 后续研究方向第104-105页
参考文献第105-121页
致谢第121-123页
攻读博士期间发表、录用和完成的学术论文目录第123-124页

论文共124页,点击 下载论文
上一篇:围产期服用OMEGA-3多不饱和脂肪酸改善七氟烷导致的新生大鼠神经退行性病变和记忆损害
下一篇:基于大数据的社交媒体区域监控技术研究