摘要 | 第4-6页 |
Abstract | 第6-8页 |
第一章 绪论 | 第16-36页 |
1.1 课题研究背景 | 第16-24页 |
1.1.1 高性能计算发展趋势 | 第16-18页 |
1.1.2 高性能计算面临的挑战 | 第18-21页 |
1.1.3 并行编译优化 | 第21-22页 |
1.1.4 SIMD编译优化 | 第22-24页 |
1.2 SIMD编译面临的挑战 | 第24-25页 |
1.3 课题研究内容 | 第25-29页 |
1.3.1 课题来源 | 第25页 |
1.3.2 研究平台 | 第25-27页 |
1.3.3 研究内容 | 第27-28页 |
1.3.4 研究意义 | 第28-29页 |
1.4 SIMD编译研究现状 | 第29-33页 |
1.4.1 依赖关系分析研究 | 第29-30页 |
1.4.2 自动向量化方法 | 第30-32页 |
1.4.3 访存优化技术 | 第32-33页 |
1.4.4 多平台向量化 | 第33页 |
1.5 论文结构 | 第33-36页 |
第二章 SIMD预优化分析技术 | 第36-62页 |
2.1 研究动机 | 第36-37页 |
2.2 问题描述 | 第37-38页 |
2.3 数据依赖关系 | 第38-39页 |
2.4 基于数据依赖关系的SIMD预优化技术 | 第39-51页 |
2.4.1 适应SIMD扩展部件的并行性分析方法 | 第40-42页 |
2.4.2 基于依赖关系逆向图的Tarjan算法 | 第42-46页 |
2.4.3 基于数据依赖关系的循环预优化技术 | 第46-48页 |
2.4.4 实验与分析 | 第48-51页 |
2.5 面向多面体模型的SIMD预优化技术 | 第51-59页 |
2.5.1 基本思路 | 第51页 |
2.5.2 多面体模型建模限制条件分析 | 第51-53页 |
2.5.3 面向多面体模型的SIMD投机优化技术 | 第53-57页 |
2.5.4 实验与分析 | 第57-59页 |
2.6 相关研究 | 第59-60页 |
2.7 本章小结 | 第60-62页 |
第三章 基于多面体模型的多重循环向量化方法 | 第62-88页 |
3.1 研究动机 | 第62-63页 |
3.2 问题描述 | 第63-64页 |
3.3 基础数学知识 | 第64-65页 |
3.4 多面体模型优化技术概况 | 第65-72页 |
3.4.1 静态控制块 | 第66页 |
3.4.2 面向循环动态特性的建模方法 | 第66-68页 |
3.4.3 面向组合循环变换的建模方法 | 第68-71页 |
3.4.4 基于多面体模型的代码生成 | 第71-72页 |
3.5 基于多面体代价模型的最优SIMD向量化方案 | 第72-80页 |
3.5.1 面向SIMD存取优化的循环变换技术 | 第72-73页 |
3.5.2 SIMD向量化方案建模方法 | 第73-76页 |
3.5.3 基于代价模型指导的最优SIMD向量化方案 | 第76-80页 |
3.6 面向应用环境的SIMD自适应循环分块方法 | 第80-83页 |
3.6.1 基于多面体模型的循环分块优化 | 第80-81页 |
3.6.2 面向应用环境的自适应循环分块方法 | 第81-83页 |
3.7 相关研究 | 第83-84页 |
3.8 实验与分析 | 第84-87页 |
3.9 本章小结 | 第87-88页 |
第四章 向量代码深度优化技术 | 第88-106页 |
4.1 研究动机 | 第88页 |
4.2 问题描述 | 第88-89页 |
4.3 基于向量重组指令的代码优化 | 第89-94页 |
4.3.1 向量重组指令 | 第89-90页 |
4.3.2 向量重组过程一般化描述 | 第90-91页 |
4.3.3 基于最大匹配度的向量重组优化 | 第91-94页 |
4.4 面向块间向量复用的代码优化 | 第94-98页 |
4.4.1 跨基本块的SIMD向量化 | 第94-95页 |
4.4.2 块间向量复用优化算法 | 第95-98页 |
4.5 面向可消除指令的代码优化 | 第98-101页 |
4.5.1 循环不变向量外提 | 第98-100页 |
4.5.2 向量操作合并 | 第100-101页 |
4.6 相关研究 | 第101页 |
4.7 实验与分析 | 第101-105页 |
4.7.1 向量重组优化测试 | 第101-102页 |
4.7.2 块间向量复用优化测试 | 第102-103页 |
4.7.3 可消除代码优化测试 | 第103-105页 |
4.8 小结 | 第105-106页 |
第五章 结论 | 第106-110页 |
5.1 论文主要工作 | 第106-108页 |
5.2 研究创新点 | 第108-109页 |
5.3 存在的不足与下一步改进 | 第109-110页 |
致谢 | 第110-111页 |
参考文献 | 第111-120页 |
作者简历 | 第120页 |