异构多核处理器OpenMP编译实现与优化
摘要 | 第1-11页 |
ABSTRACT | 第11-12页 |
第一章 引言 | 第12-20页 |
§1.1 课题背景 | 第12-14页 |
·多核处理器成为高性能微处理器发展的主流 | 第12页 |
·同构多核处理器与编译技术 | 第12-13页 |
·异构多核处理器与编译技术 | 第13-14页 |
§1.2 研究现状 | 第14-16页 |
·国外研究现状 | 第14-16页 |
·国内研究现状 | 第16页 |
§1.3 OpenMP移植到异构多核处理上的挑战 | 第16-18页 |
§1.4 本文研究内容和创新 | 第18-19页 |
§1.5 本文结构 | 第19-20页 |
第二章 Cell处理器及OpenMP并行编程标准 | 第20-27页 |
§2.1 Cell处理器 | 第20-23页 |
·概述 | 第20-21页 |
·硬件环境 | 第21页 |
·软件环境 | 第21-23页 |
§2.2 OpenMP并行编程标准 | 第23-25页 |
·OpenMP简介 | 第23-24页 |
·执行模型 | 第24页 |
·数据分布 | 第24页 |
·实现 | 第24-25页 |
·总结 | 第25页 |
§2.3 OpenMP到Cell处理器上的移植 | 第25-27页 |
·两种指令集的编译及并行任务分派方式 | 第25页 |
·对分布式存储的抽象 | 第25-26页 |
·SPE本地存储空间的限制 | 第26页 |
·运行库的设计 | 第26-27页 |
第三章 Cell处理器上OpenMP编译实现技术 | 第27-38页 |
§3.1 执行模型 | 第27-29页 |
·执行模型 | 第27-28页 |
·执行序列 | 第28页 |
·执行模型的特点 | 第28-29页 |
§3.2 单源编译技术 | 第29-30页 |
·SPE执行程序的抽取 | 第29-30页 |
·分别编译 | 第30页 |
·生成可执行程序 | 第30页 |
§3.3 共享存储抽象技术 | 第30-31页 |
§3.4 OpenMP编译的实现 | 第31-37页 |
·属性变量的处理 | 第31-34页 |
·特殊变量的处理 | 第34页 |
·控制结构的转换 | 第34-36页 |
·运行库的处理 | 第36-37页 |
§3.5 本章小结 | 第37-38页 |
第四章 Cell处理器上OpenMP编译优化技术 | 第38-54页 |
§4.1 软件cache技术 | 第38-43页 |
·软件cache技术概述 | 第38-39页 |
·用户接口 | 第39页 |
·组织形式 | 第39-40页 |
·存储一致性模型和同步操作原语 | 第40页 |
·Cache Coherence协议 | 第40-41页 |
·多处理器的支持 | 第41-42页 |
·查找流程 | 第42-43页 |
§4.2 代码重叠技术 | 第43-53页 |
·代码重叠技术概述 | 第43-44页 |
·Cell处理器上代码重叠技术的实现原理 | 第44-45页 |
·编译器的支持 | 第45-50页 |
·汇编器的支持 | 第50-51页 |
·链接器的支持 | 第51页 |
·Partition Manager的实现 | 第51-53页 |
§4.3 本章小结 | 第53-54页 |
第五章 测试与分析 | 第54-60页 |
§5.1 测试环境 | 第54页 |
§5.2 功能测试 | 第54-56页 |
·测试用例 | 第54-56页 |
·测试结果与分析 | 第56页 |
§5.3 性能测试 | 第56-60页 |
·自动代码划分算法的性能测试 | 第56-57页 |
·软件cache的性能测试 | 第57-58页 |
·并行性能测试 | 第58-60页 |
第六章 结束语 | 第60-62页 |
§6.1 工作总结 | 第60页 |
§6.2 展望 | 第60-62页 |
致谢 | 第62-63页 |
参考文献 | 第63-66页 |
作者在读期间取得的学术成果 | 第66页 |