首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于FT-Matrix2的自动向量化关键技术研究与实现

摘要第9-10页
ABSTRACT第10页
第一章 绪论第11-19页
    1.1 研究背景第11-12页
    1.2 自动向量化简介及研究现状第12-15页
    1.3 开发平台选择第15-16页
    1.4 论文的主要工作第16-17页
    1.5 论文结构和组织第17-19页
第二章 GCC自动向量化框架分析第19-34页
    2.1 GCC编译结构分析第19-23页
    2.2 自动向量化的的框架分析第23-33页
        2.2.1 循环的向量化可行性分析第25-30页
        2.2.2 循环的向量化转换第30-33页
    2.3 本章小结第33-34页
第三章 基于FT-Matrix2的自动向量化实现第34-46页
    3.1 FT-Matrix2体系结构第34-37页
        3.1.1 FT-Matrix2内核结构第34-35页
        3.1.2 FT-Matrix2指令集第35-37页
    3.2 FT-Matrix2向量后端移植第37-41页
        3.2.1 向量寄存器描述第37-38页
        3.2.2 向量数据机器模式第38-41页
    3.3 FT-Matrix2向量指令实现第41-45页
        3.3.1 指令映射分析第41-42页
        3.3.2 指令映射实现第42-45页
    3.4 本章小结第45-46页
第四章 基于FT-Matrix2的向量访存实现第46-57页
    4.1 FT-Matrix2向量访存介绍与分析第46-47页
    4.2 自动向量化的向量访存实现过程第47-48页
    4.3 基于DMA自动传输的向量访存实现第48-54页
    4.4 基于SVR传输的向量访存实现第54-56页
    4.5 本章小结第56-57页
第五章 基于FT-Matrix2的FFT算法的自动向量化实现第57-68页
    5.1 FFT算法介绍及分析第57-61页
        5.1.1 FFT算法介绍第57-58页
        5.1.2 FFT算法的自动向量化实现分析第58-61页
    5.2 实验结果及性能分析第61-67页
    5.3 本章小结第67-68页
第六章 总结与展望第68-71页
    6.1 全文总结第68-69页
    6.2 展望第69-71页
致谢第71-73页
参考文献第73-77页
作者在学期间取得的学术成果第77页

论文共77页,点击 下载论文
上一篇:基于FT-C6XX多核DSP的MPI移植实现与优化
下一篇:基于知识发酵的组织核心能力研究