首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

面向新型异构众核系统的多设备协同并行计算关键技术研究

摘要第5-7页
Abstract第7-9页
第1章 绪论第16-33页
    1.1 研究背景第16-21页
        1.1.1 新型异构众核系统的体系结构第16-19页
        1.1.2 基于异构众核系统的并行应用第19-20页
        1.1.3 异构协同并行计算面临的挑战第20-21页
    1.2 研究现状第21-29页
        1.2.1 异构众核系统中的编程模型第21-24页
        1.2.2 异构众核系统中的任务调度第24-27页
        1.2.3 异构众核系统中的通信优化第27-29页
    1.3 研究内容及贡献第29-32页
        1.3.1 本文的研究内容第29-31页
        1.3.2 本文的主要贡献第31-32页
    1.4 本文组织结构第32-33页
第2章 基于指导语句的异构协同并行编程框架OpenHCPP第33-54页
    2.1 引言第33-34页
    2.2 相关工作第34-35页
    2.3 OpenHCPP并行编程框架的设计第35-42页
        2.3.1 OpenHCPP总体架构设计第35-36页
        2.3.2 设备间静态任务调度第36-39页
        2.3.3 OpenMP导语和子句的扩展第39-41页
        2.3.4 OpenHCPP编程案例第41-42页
    2.4 OpenHCPP并行编程框架的实现第42-46页
        2.4.1 OpenHCPP编译器第42-44页
        2.4.2 OpenHCPP运行时系统第44-46页
    2.5 实验评测第46-53页
        2.5.1 实验设置第46页
        2.5.2 可编程性评测第46-48页
        2.5.3 性能评测第48-53页
    2.6 小结第53-54页
第3章 异构协同并行计算中设备间动态任务调度第54-73页
    3.1 引言第54-55页
    3.2 相关工作第55-58页
        3.2.1 Quick调度策略第55-57页
        3.2.2 Split调度策略第57-58页
    3.3 反馈式动态弹性任务调度策略第58-62页
    3.4 抢占式动态弹性任务调度策略第62-66页
    3.5 实验评测第66-72页
        3.5.1 多种动态任务调度策略性能对比第66-70页
        3.5.2 初始块大小性能影响分析第70-71页
        3.5.3 动态调度开销分析第71-72页
    3.6 小结第72-73页
第4章 异构协同并行计算中设备间通信优化第73-94页
    4.1 引言第73-74页
    4.2 相关工作第74-75页
    4.3 增量式数据传输方法第75-81页
        4.3.1 增量式数据传输的产生背景第75-76页
        4.3.2 避免重复传输的反馈式动态任务调度第76-80页
        4.3.3 增量式数据传输的应用第80-81页
    4.4 基于软件流水线的通信优化方法第81-87页
        4.4.1 基于软件流水线的通信优化的基本思想第81-82页
        4.4.2 隐藏通信开销的反馈式动态弹性任务调度第82-85页
        4.4.3 隐藏通信开销的抢占式动态弹性任务调度第85-87页
    4.5 实验评测第87-92页
        4.5.1 通信优化前后性能对比第87-90页
        4.5.2 多GPU实验测试第90-91页
        4.5.3 与StarPU和OmpSs的性能比较第91-92页
    4.6 小结第92-94页
第5章 异构协同并行计算在求解子集和问题中的应用第94-113页
    5.1 引言第94-95页
    5.2 相关工作第95页
    5.3 求解子集和问题的并行二表算法第95-96页
        5.3.1 并行二表算法的生成阶段第95-96页
        5.3.2 并行二表算法的剪块阶段第96页
        5.3.3 并行二表算法的搜索阶段第96页
    5.4 并行二表算法的异构协同并行实现第96-108页
        5.4.1 生成阶段的异构协同并行实现第97-103页
        5.4.2 剪块与搜索阶段的异构协同并行实现第103-108页
    5.5 实验评测第108-112页
        5.5.1 实验设置第108页
        5.5.2 不同并行实现的性能对比第108-111页
        5.5.3 不同测试平台的性能对比第111页
        5.5.4 不同背包容量的性能对比第111-112页
    5.6 小结第112-113页
第6章 结论与展望第113-115页
    6.1 工作总结第113-114页
    6.2 研究展望第114-115页
参考文献第115-125页
致谢第125-126页
附录A 攻读学位期间所完成的论文第126-127页
附录B 攻读学位期间所参与的科研项目第127页

论文共127页,点击 下载论文
上一篇:基于HADOOP的分布式云平台搜索系统设计与实现
下一篇:混合动力挖掘机回转驱动系统的控制技术研究