面向国产处理器的OpenMP程序编译优化技术研究

摘要	第4-5页
Abstract	第5页
第一章绪论	第10-17页
1.1 研究背景	第10-12页
1.1.1 高性能计算机发展概况	第10-11页
1.1.2 并行化	第11-12页
1.2 国产处理器介绍	第12-13页
1.3 OpenMP简介	第13-15页
1.4 课题来源	第15-16页
1.5 论文结构安排	第16-17页
第二章 DOALL循环调度策略研究	第17-29页
2.1 DOALL循环的循环调度算法	第17-20页
2.1.1 自调度	第18页
2.1.2 固定大小分块调度	第18-19页
2.1.3 引导自调度	第19页
2.1.4 因式分解	第19-20页
2.1.5 梯形自调度	第20页
2.2 DOALL循环调度算法的比较分析	第20-22页
2.3 在多处理器上的DOALL循环调度	第22-25页
2.3.1 亲和性调度	第23页
2.3.2 分区亲和性调度	第23-25页
2.3.3 基于位置的动态调度	第25页
2.4 亲和性调度策略的比较	第25-28页
2.5 本章小结	第28-29页
第三章 DOACROSS循环调度策略研究	第29-44页
3.1 规则DOACROSS模型	第29-33页
3.1.1 预同步调度	第31-32页
3.1.2 交错分配方案	第32-33页
3.1.3 循环交错分布	第33页
3.2 规则DOACROSS调度方案的比较	第33-34页
3.3 不规则DOACROSS模型	第34-41页
3.3.1 预同步调度	第35-37页
3.3.2 运行时并行化方案	第37-41页
3.4 不规则DOACROSS调度方案的比较	第41-43页
3.5 本章小结	第43-44页
第四章循环自动并行化技术研究	第44-55页
4.1 研究动机	第44页
4.2 体系结构的并行性	第44-48页
4.2.1 向量并行	第45-46页
4.2.2 核级并行	第46页
4.2.3 节点级并行	第46-47页
4.2.4 异构并行	第47-48页
4.3 自动并行化流程	第48-49页
4.4 循环并行方式	第49-53页
4.4.1 SIMD向量并行	第50-51页
4.4.2 DOALL并行	第51-52页
4.4.3 DOACROSS流水并行	第52页
4.4.4 TASK流水并行	第52-53页
4.5 本章小结	第53-55页
第五章实验分析及测试	第55-58页
5.1 自动向量化能力	第55-56页
5.2 自动并行化能力	第56-57页
5.3 本章小结	第57-58页
第六章总结与展望	第58-60页
6.1 工作总结	第58页
6.2 展望与计划	第58-60页
致谢	第60-61页
参考文献	第61-65页
作者简历	第65页