首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

面向SIMD的向量化算法及重组技术研究

表目录第7-8页
图目录第8-11页
摘要第11-13页
ABSTRACT第13-14页
第一章 绪论第15-37页
    1.1 课题研究背景第15-18页
        1.1.1 向量机与 SIMD 扩展第15-17页
        1.1.2 针对 SIMD 的自动向量化第17-18页
    1.2 向量化的主要方法第18-27页
        1.2.1 传统向量化方法第18-21页
        1.2.2 超字并行(SLP)第21-25页
        1.2.3 其他的向量化方法第25-27页
    1.3 向量化所面临的挑战第27-29页
        1.3.1 向量化方法第27页
        1.3.2 数据布局及相关优化第27-28页
        1.3.3 向量重组第28-29页
    1.4 Open64 及其中间表示第29-32页
    1.5 课题研究内容第32-34页
        1.5.1 课题研究内容第32-33页
        1.5.2 课题研究意义第33-34页
        1.5.3 课题研究平台第34页
    1.6 论文的组织结构第34-37页
第二章 改进的 SLP 算法 RLRSLP 和 ISGSLP第37-61页
    2.1 研究动机第37-40页
    2.2 相关研究第40页
    2.3 RLRSLP 和 ISGSLP 算法的实现框架第40-55页
        2.3.1 彻底的三地址化和标量重命名第41-43页
        2.3.2 构建依赖关系图第43-45页
        2.3.3 依赖关系指导下 UD 扩展优先的 pack 生成第45-49页
        2.3.4 整体收益分析第49-51页
        2.3.5 删除冗余的 load pack 以及三地址化的恢复第51页
        2.3.6 向量化代码生成及优化第51-55页
    2.4 实验结果及分析第55-60页
        2.4.1 RLRSLP 算法性能测试第55-57页
        2.4.2 ISGSLP 算法性能测试第57-60页
    2.5 小结第60-61页
第三章 基于 SLP 的辅助优化第61-91页
    3.1 研究动机第61-65页
    3.2 相关研究第65-67页
    3.3 预优化第67-75页
        3.3.1 过程内数组转置第67-69页
        3.3.2 过程间数组填充第69-70页
        3.3.3 对齐优化第70-73页
        3.3.4 消减 store 语句携带的依赖第73-75页
        3.3.5 进行规约变换第75页
    3.4 SLP 向量化之后的辅助优化第75-80页
        3.4.1 进行向量操作合并第76页
        3.4.2 循环不变向量化代码外提第76-77页
        3.4.3 冗余向量赋值语句消除第77-79页
        3.4.4 寄存器重用优化第79-80页
    3.5 实验结果和分析第80-88页
        3.5.1 针对短依赖距离循环的向量化性能测试第80-81页
        3.5.2 针对数据重组和对齐分析的性能测试第81-82页
        3.5.3 针对其他优化的性能测试第82-88页
    3.6 小结第88-91页
第四章 面向 SIMD 的多重循环向量化第91-107页
    4.1 研究动机第91-93页
    4.2 相关研究第93-94页
    4.3 面向多重循环的向量化算法与实现第94-102页
        4.3.1 编译框架第94-95页
        4.3.2 候选循环识别第95页
        4.3.3 基于 SLP 的多重循环向量化第95-99页
        4.3.4 决定循环变换方案第99-100页
        4.3.5 用 ISGSLP 进行向量发掘和代码生成第100-102页
    4.4 实验结果及分析第102-105页
    4.5 小结第105-107页
第五章 面向 SW1600 的向量重组第107-119页
    5.1 研究动机及研究现状第107-109页
    5.2 目标系统的向量重组指令第109-110页
    5.3 向量重组的实现方法第110-114页
        5.3.1 用移位实现向量重组第110-111页
        5.3.2 用插入提取实现向量重组第111-112页
        5.3.3 综合移位和插入提取实现向量重组第112-114页
    5.4 实验结果与分析第114-116页
    5.5 小结第116-119页
结束语第119-122页
参考文献第122-129页
作者简历 攻读博士学位期间完成的主要工作第129-130页
致谢第130页

论文共130页,点击 下载论文
上一篇:网络加密流量的协议不相关在线识别技术研究
下一篇:基于P2P流媒体模型的流量特征分析及实时分类