面向矢量信号处理的自动向量化算法研究
摘要 | 第3-4页 |
Abstract | 第4-5页 |
注释表 | 第13-14页 |
第1章 引言 | 第14-22页 |
1.1 研究背景 | 第14-15页 |
1.2 课题来源 | 第15-16页 |
1.3 国内外研究现状 | 第16-20页 |
1.4 研究内容 | 第20-21页 |
1.5 论文组织结构 | 第21-22页 |
第2章 LLVM及优化平台介绍 | 第22-39页 |
2.1 编译器设计与实现 | 第22-24页 |
2.1.1 三段式设计框架 | 第22-23页 |
2.1.2 三段式编译器实现 | 第23-24页 |
2.2 LLVM优化系统架构 | 第24-27页 |
2.3 LLVM IR | 第27-29页 |
2.4 LLVM优化 | 第29-37页 |
2.4.1 LLVM向量化 | 第29-30页 |
2.4.2 循环正规化 | 第30-36页 |
2.4.3 LLVM自动向量化 | 第36-37页 |
2.5 实验结果 | 第37-38页 |
2.6 本章小结 | 第38-39页 |
第3章 自动向量化算法研究 | 第39-52页 |
3.1 基本块自动向量化算法框架 | 第39页 |
3.2 向量化指令对的选取 | 第39-42页 |
3.3 大规模指令并行 | 第42-49页 |
3.4 向量指令的替换 | 第49-50页 |
3.5 向量化算法难点研究 | 第50-51页 |
3.6 本章小结 | 第51-52页 |
第4章 基于深度因子改进的自动向量化算法 | 第52-77页 |
4.1 深度因子简述 | 第52-55页 |
4.1.1 深度因子的定义及构造方法 | 第52-54页 |
4.1.2 深度因子的使用 | 第54-55页 |
4.2 基于静态深度因子的改进算法 | 第55-61页 |
4.2.1 问题分析 | 第55-57页 |
4.2.2 基于静态深度因子改进算法 | 第57-58页 |
4.2.3 算法流程 | 第58-61页 |
4.3 动态深度因子的构建算法 | 第61-71页 |
4.3.1 问题分析 | 第61-63页 |
4.3.2 改进算法分析 | 第63-71页 |
4.4 子树生成顺序的随机性改进 | 第71-72页 |
4.5 深度因子与广度因子进一步改进思路 | 第72-75页 |
4.5.1 问题分析 | 第72页 |
4.5.2 广度算法的实现 | 第72-75页 |
4.6 本章小结 | 第75-77页 |
第5章 测试及实验结果分析 | 第77-85页 |
5.1 实验环境 | 第77页 |
5.2 测试结果及分析 | 第77-84页 |
5.2.1 单元测试例性能测试及结果分析 | 第77-80页 |
5.2.2 大型程序测试及结果分析 | 第80-84页 |
5.3 本章小结 | 第84-85页 |
第6章 总结与展望 | 第85-87页 |
参考文献 | 第87-92页 |
致谢 | 第92-93页 |
攻读硕士学位期间从事的科研工作及取得的成果 | 第93-94页 |
附录 | 第94页 |