首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

面向共享存储结构的并行编译优化技术研究

摘要第4-5页
Abstract第5-6页
图录第10-12页
表录第12-13页
第一章 绪论第13-29页
    1.1 并行体系结构概述第14-18页
        1.1.1 并行体系结构的发展历程第14-15页
        1.1.2 影响现代并行体系结构性能发挥的因素第15-17页
        1.1.3 共享存储并行系统第17-18页
    1.2 并行化编译技术第18-25页
        1.2.1 发展现状第20-24页
        1.2.2 面临的技术挑战第24-25页
    1.3 研究内容第25-28页
        1.3.1 面向规则DOACROSS循环的自动并行第25-26页
        1.3.2 OpenMP PS-DSWP并行第26-27页
        1.3.3 面向OpenMP自动并行化的代价模型第27页
        1.3.4 面向异构系统的数据传输优化第27-28页
    1.4 论文的组织结构第28-29页
第二章 规则DOACROSS循环的自动并行第29-53页
    2.1 问题的提出第29-31页
    2.2 相关研究第31-33页
    2.3 流水并行粒度的优化第33-39页
        2.3.1 基于循环分块增大流水粒度第33-36页
        2.3.2 基于循环分块减小流水粒度第36-38页
        2.3.3 流水并行代价模型第38-39页
        2.3.4 流水并行粒度优化算法及实例分析第39页
    2.4 流水并行代码的自动生成第39-45页
        2.4.1 选择计算划分层和循环分块层第40-42页
        2.4.2 计算划分第42-43页
        2.4.3 同步的实现第43-45页
        2.4.4 流水并行代码自动生成算法第45页
    2.5 实验结果与分析第45-51页
        2.5.1 并行性能测试第46-50页
        2.5.2 分块大小选择测试第50-51页
    2.6 本章小结第51-53页
第三章 OpenMP PS—DSWP自动并行第53-77页
    3.1 问题的提出第54-56页
    3.2 相关研究第56-57页
    3.3 基于OpenMP的PS-DSWP并行第57-66页
        3.3.1 线程任务的分配第57-62页
        3.3.2 线程间依赖关系的处理第62-63页
        3.3.3 OpenMP PS-DSWP自动并行算法第63-65页
        3.3.4 正确性证明第65-66页
    3.4 OpenMP任务调度机制的扩展与实现第66-70页
        3.4.1 OpenMP任务调度机制第66-67页
        3.4.2 扩展的任务绑定属性第67-68页
        3.4.3 任务绑定属性在GCC中的实现第68-70页
    3.5 实验结果与分析第70-74页
        3.5.1 对热点循环的测试第72-73页
        3.5.2 对NPB3.3.1的测试第73-74页
    3.6 本章小结第74-77页
第四章 自动并行化中的代价模型第77-97页
    4.1 问题的提出第77-79页
        4.1.1 并行收益分析第77页
        4.1.2 代价模型第77-79页
    4.2 相关研究第79-80页
    4.3 代价模型的建立第80-92页
        4.3.1 硬件模型第82-84页
        4.3.2 串行代价模型第84页
        4.3.3 并行代价模型第84-92页
    4.4 实验结果及分析第92-96页
        4.4.1 测试方法第92-93页
        4.4.2 测试结果第93-96页
    4.5 本章小结第96-97页
第五章 面向异构系统的数据传输优化第97-111页
    5.1 问题的提出第97-98页
    5.2 相关研究第98-99页
    5.3 对OpenMP数据管理机制的扩展第99-101页
    5.4 分块规则数组区域第101-104页
        5.4.1 分块规则数组区域的定义第101-103页
        5.4.2 分块规则数组区域的合并操作第103-104页
    5.5 数据加载子句的自动生成第104-107页
        5.5.1 多面体模型第104-106页
        5.5.2 单个数组引用第106-107页
        5.5.3 更加复杂的情况第107页
    5.6 实验结果及分析第107-109页
        5.6.1 测试环境第107页
        5.6.2 测试结果及分析第107-109页
    5.7 本章小结第109-111页
第六章 结论与展望第111-115页
    6.1 全文工作总结第111-113页
    6.2 下一步工作展望第113-115页
致谢第115-117页
参考文献第117-125页
作者简历第125页

论文共125页,点击 下载论文
上一篇:Best Practices in Rubber Wood Process Industry in Thailand Competitiveness
下一篇:近场通信环境中的离线安全协议理论与应用研究