首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

CPU-GPU异构平台的性能优化研究及其在实时信号模拟技术中的应用

致谢第4-5页
摘要第5-6页
Abstract第6页
1 绪论第14-23页
    1.1 研究背景第14-18页
        1.1.1 单核的消亡以及多核的出现第14-16页
        1.1.2 异构并行计算的崛起和未来第16-18页
    1.2 国内外现状第18-21页
        1.2.1 CPU-GPU异构计算的研究现状第18-19页
        1.2.2 实时信号模拟的研究现状第19-21页
    1.3 论文结构第21-23页
2 OpenCL的技术研究第23-38页
    2.1 OpenCL简介第23页
    2.2 OpenCL体系结构第23-30页
        2.2.1 平台模型第23-24页
        2.2.2 执行模型第24-28页
        2.2.3 内存模型第28-29页
        2.2.4 OpenCL的组成框架第29-30页
    2.3 OpenCL编程步骤第30-31页
    2.4 GPU与OpenCL体系结构的映射关系第31-38页
        2.4.1 主流GPU的对比第31-32页
        2.4.2 GCN GPU的架构第32-36页
        2.4.3 Mali GPU的架构第36-38页
3 CPU-GPU异构平台的性能优化研究第38-64页
    3.1 OpenCL程序性能的影响因素第38-41页
        3.1.1 数据传输第38-39页
        3.1.2 内存访问第39页
        3.1.3 负载分配第39-40页
        3.1.4 同步开销第40-41页
    3.2 数据传输的优化技术第41-48页
        3.2.1 缓冲区的使用策略研究第41-44页
        3.2.2 组包和分片数据传输第44-46页
        3.2.3 共享内存的CPU-GPU平台研究第46-48页
        3.2.4 数据传输优化小结第48页
    3.3 内存访问的优化技术第48-56页
        3.3.1 私有内存使用策略第48-50页
        3.3.2 局部内存使用策略第50-51页
        3.3.3 常量内存使用策略第51-52页
        3.3.4 全局内存使用策略第52-55页
        3.3.5 内存访问优化小结第55-56页
    3.4 负载分配的优化研究第56-60页
        3.4.1 CPU上的命令控制策略第56-57页
        3.4.2 GPU上的计算、线程和分支研究第57-60页
    3.5 同步/异步的优化策略第60-63页
        3.5.1 计算和通信流水化第60-61页
        3.5.2 全局内存和局部内存的异步读写第61页
        3.5.3 内核融合与原子操作同步第61-63页
    3.6 本章小结第63-64页
4 基于CPU-GPU异构平台的实时信号模拟技术第64-82页
    4.1 实时信号模拟平台简介第64-67页
        4.1.1 功能和用途第64-65页
        4.1.2 数据流与硬件组成第65-66页
        4.1.3 需求分析第66-67页
    4.2 软件架构设计第67-69页
        4.2.1 事务逻辑框架第67-68页
        4.2.2 软件框架设计第68-69页
    4.3 CPU上的性能优化设计第69-73页
        4.3.1 数据传输性能优化第69-71页
        4.3.2 实时计算流水线化第71页
        4.3.3 短时任务判别与计算第71-73页
    4.4 GPU上的性能优化设计第73-81页
        4.4.1 GPU端的任务第73-74页
        4.4.2 基础信号生成设计第74-76页
        4.4.3 干扰信号生成设计第76-78页
        4.4.4 噪声信号生成设计第78-79页
        4.4.5 杂波信号叠加设计第79-80页
        4.4.6 多GPU平台的设计第80-81页
    4.5 本章小结第81-82页
5 验证与测试第82-91页
    5.1 测试平台第82-84页
        5.1.1 CPU、GPU和OpenCL的参数第82-83页
        5.1.2 CPU和GPU运行经典算法的性能第83-84页
        5.1.3 测试术语定义第84页
    5.2 CPU部分的性能测试第84-87页
        5.2.1 数据传输性能优化的测试第84-85页
        5.2.2 实时计算流水线化的测试第85-86页
        5.2.3 短时任务计算不同方案的测试第86-87页
    5.3 GPU部分的性能测试第87-89页
        5.3.1 内核函数资源占用率测试第87-88页
        5.3.2 目标计算能力测试第88页
        5.3.3 多GPU的计算能力测试第88-89页
    5.4 综合处理能力测试第89-90页
    5.5 本章小结第90-91页
6 总结与展望第91-93页
    6.1 总结第91页
    6.2 展望第91-93页
附录第93-103页
作者简历第103-104页
参考文献第104-106页

论文共106页,点击 下载论文
上一篇:铝合金型材冲裁自动线关键部件的设计与研究
下一篇:轿车车门玻璃升降阻力与车门制造偏差的关系研究