异构多核处理器OpenMP编译实现与优化
| 摘要 | 第1-11页 |
| ABSTRACT | 第11-12页 |
| 第一章 引言 | 第12-20页 |
| §1.1 课题背景 | 第12-14页 |
| ·多核处理器成为高性能微处理器发展的主流 | 第12页 |
| ·同构多核处理器与编译技术 | 第12-13页 |
| ·异构多核处理器与编译技术 | 第13-14页 |
| §1.2 研究现状 | 第14-16页 |
| ·国外研究现状 | 第14-16页 |
| ·国内研究现状 | 第16页 |
| §1.3 OpenMP移植到异构多核处理上的挑战 | 第16-18页 |
| §1.4 本文研究内容和创新 | 第18-19页 |
| §1.5 本文结构 | 第19-20页 |
| 第二章 Cell处理器及OpenMP并行编程标准 | 第20-27页 |
| §2.1 Cell处理器 | 第20-23页 |
| ·概述 | 第20-21页 |
| ·硬件环境 | 第21页 |
| ·软件环境 | 第21-23页 |
| §2.2 OpenMP并行编程标准 | 第23-25页 |
| ·OpenMP简介 | 第23-24页 |
| ·执行模型 | 第24页 |
| ·数据分布 | 第24页 |
| ·实现 | 第24-25页 |
| ·总结 | 第25页 |
| §2.3 OpenMP到Cell处理器上的移植 | 第25-27页 |
| ·两种指令集的编译及并行任务分派方式 | 第25页 |
| ·对分布式存储的抽象 | 第25-26页 |
| ·SPE本地存储空间的限制 | 第26页 |
| ·运行库的设计 | 第26-27页 |
| 第三章 Cell处理器上OpenMP编译实现技术 | 第27-38页 |
| §3.1 执行模型 | 第27-29页 |
| ·执行模型 | 第27-28页 |
| ·执行序列 | 第28页 |
| ·执行模型的特点 | 第28-29页 |
| §3.2 单源编译技术 | 第29-30页 |
| ·SPE执行程序的抽取 | 第29-30页 |
| ·分别编译 | 第30页 |
| ·生成可执行程序 | 第30页 |
| §3.3 共享存储抽象技术 | 第30-31页 |
| §3.4 OpenMP编译的实现 | 第31-37页 |
| ·属性变量的处理 | 第31-34页 |
| ·特殊变量的处理 | 第34页 |
| ·控制结构的转换 | 第34-36页 |
| ·运行库的处理 | 第36-37页 |
| §3.5 本章小结 | 第37-38页 |
| 第四章 Cell处理器上OpenMP编译优化技术 | 第38-54页 |
| §4.1 软件cache技术 | 第38-43页 |
| ·软件cache技术概述 | 第38-39页 |
| ·用户接口 | 第39页 |
| ·组织形式 | 第39-40页 |
| ·存储一致性模型和同步操作原语 | 第40页 |
| ·Cache Coherence协议 | 第40-41页 |
| ·多处理器的支持 | 第41-42页 |
| ·查找流程 | 第42-43页 |
| §4.2 代码重叠技术 | 第43-53页 |
| ·代码重叠技术概述 | 第43-44页 |
| ·Cell处理器上代码重叠技术的实现原理 | 第44-45页 |
| ·编译器的支持 | 第45-50页 |
| ·汇编器的支持 | 第50-51页 |
| ·链接器的支持 | 第51页 |
| ·Partition Manager的实现 | 第51-53页 |
| §4.3 本章小结 | 第53-54页 |
| 第五章 测试与分析 | 第54-60页 |
| §5.1 测试环境 | 第54页 |
| §5.2 功能测试 | 第54-56页 |
| ·测试用例 | 第54-56页 |
| ·测试结果与分析 | 第56页 |
| §5.3 性能测试 | 第56-60页 |
| ·自动代码划分算法的性能测试 | 第56-57页 |
| ·软件cache的性能测试 | 第57-58页 |
| ·并行性能测试 | 第58-60页 |
| 第六章 结束语 | 第60-62页 |
| §6.1 工作总结 | 第60页 |
| §6.2 展望 | 第60-62页 |
| 致谢 | 第62-63页 |
| 参考文献 | 第63-66页 |
| 作者在读期间取得的学术成果 | 第66页 |