首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

多重循环SIMD向量化方法及性能优化技术研究

摘要第4-6页
Abstract第6-8页
第一章 绪论第16-36页
    1.1 课题研究背景第16-24页
        1.1.1 高性能计算发展趋势第16-18页
        1.1.2 高性能计算面临的挑战第18-21页
        1.1.3 并行编译优化第21-22页
        1.1.4 SIMD编译优化第22-24页
    1.2 SIMD编译面临的挑战第24-25页
    1.3 课题研究内容第25-29页
        1.3.1 课题来源第25页
        1.3.2 研究平台第25-27页
        1.3.3 研究内容第27-28页
        1.3.4 研究意义第28-29页
    1.4 SIMD编译研究现状第29-33页
        1.4.1 依赖关系分析研究第29-30页
        1.4.2 自动向量化方法第30-32页
        1.4.3 访存优化技术第32-33页
        1.4.4 多平台向量化第33页
    1.5 论文结构第33-36页
第二章 SIMD预优化分析技术第36-62页
    2.1 研究动机第36-37页
    2.2 问题描述第37-38页
    2.3 数据依赖关系第38-39页
    2.4 基于数据依赖关系的SIMD预优化技术第39-51页
        2.4.1 适应SIMD扩展部件的并行性分析方法第40-42页
        2.4.2 基于依赖关系逆向图的Tarjan算法第42-46页
        2.4.3 基于数据依赖关系的循环预优化技术第46-48页
        2.4.4 实验与分析第48-51页
    2.5 面向多面体模型的SIMD预优化技术第51-59页
        2.5.1 基本思路第51页
        2.5.2 多面体模型建模限制条件分析第51-53页
        2.5.3 面向多面体模型的SIMD投机优化技术第53-57页
        2.5.4 实验与分析第57-59页
    2.6 相关研究第59-60页
    2.7 本章小结第60-62页
第三章 基于多面体模型的多重循环向量化方法第62-88页
    3.1 研究动机第62-63页
    3.2 问题描述第63-64页
    3.3 基础数学知识第64-65页
    3.4 多面体模型优化技术概况第65-72页
        3.4.1 静态控制块第66页
        3.4.2 面向循环动态特性的建模方法第66-68页
        3.4.3 面向组合循环变换的建模方法第68-71页
        3.4.4 基于多面体模型的代码生成第71-72页
    3.5 基于多面体代价模型的最优SIMD向量化方案第72-80页
        3.5.1 面向SIMD存取优化的循环变换技术第72-73页
        3.5.2 SIMD向量化方案建模方法第73-76页
        3.5.3 基于代价模型指导的最优SIMD向量化方案第76-80页
    3.6 面向应用环境的SIMD自适应循环分块方法第80-83页
        3.6.1 基于多面体模型的循环分块优化第80-81页
        3.6.2 面向应用环境的自适应循环分块方法第81-83页
    3.7 相关研究第83-84页
    3.8 实验与分析第84-87页
    3.9 本章小结第87-88页
第四章 向量代码深度优化技术第88-106页
    4.1 研究动机第88页
    4.2 问题描述第88-89页
    4.3 基于向量重组指令的代码优化第89-94页
        4.3.1 向量重组指令第89-90页
        4.3.2 向量重组过程一般化描述第90-91页
        4.3.3 基于最大匹配度的向量重组优化第91-94页
    4.4 面向块间向量复用的代码优化第94-98页
        4.4.1 跨基本块的SIMD向量化第94-95页
        4.4.2 块间向量复用优化算法第95-98页
    4.5 面向可消除指令的代码优化第98-101页
        4.5.1 循环不变向量外提第98-100页
        4.5.2 向量操作合并第100-101页
    4.6 相关研究第101页
    4.7 实验与分析第101-105页
        4.7.1 向量重组优化测试第101-102页
        4.7.2 块间向量复用优化测试第102-103页
        4.7.3 可消除代码优化测试第103-105页
    4.8 小结第105-106页
第五章 结论第106-110页
    5.1 论文主要工作第106-108页
    5.2 研究创新点第108-109页
    5.3 存在的不足与下一步改进第109-110页
致谢第110-111页
参考文献第111-120页
作者简历第120页

论文共120页,点击 下载论文
上一篇:解放长特公司零部件生产运营管理流程优化研究
下一篇:论虚假破产罪的构成及认定