首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

面向向量处理器的QR分解算法设计与实现

摘要第10-12页
ABSTRACT第12-13页
第一章 绪论第14-27页
    1.1 论文研究背景及意义第14-19页
        1.1.1 QR分解应用背景第14-15页
        1.1.2 DSP处理器第15-17页
        1.1.3 QR分解相关研究第17-19页
    1.2 Matrix体系结构第19-24页
        1.2.1 多核结构第19-20页
        1.2.2 单核结构第20-21页
        1.2.3 Matrix的DMA基本功能第21-22页
        1.2.4 Matrix的存储结构第22页
        1.2.5 影响算法性能的因素第22-24页
    1.3 汇编程序优化第24页
    1.4 本文研究内容第24-25页
    1.5 论文的组织结构第25-27页
第二章 Givens旋转的QR分解算法设计与实现第27-39页
    2.1 Givens旋转算法基本原理第27-29页
        2.1.1 算法原理第27-28页
        2.1.2 算法分析第28-29页
    2.2 Givens旋转的向量化方法第29-31页
        2.2.1 向量化方法设计与实现第29-30页
        2.2.2 内核算法的向量化第30-31页
    2.3 算法优化策略第31-36页
        2.3.1 双缓冲DMA策略第31-32页
        2.3.2 数据布局第32-33页
        2.3.3 软件流水第33-35页
        2.3.4 程序优化第35-36页
    2.4 测试结果及分析第36-38页
    2.5 本章小结第38-39页
第三章 Gram-Schmidt正交化QR分解算法设计与实现第39-54页
    3.1 Gram-schmidt算法基本原理第39-41页
        3.1.1 算法原理第39-40页
        3.1.2 算法分析第40-41页
    3.2 Gram-schmidt正交化QR分解算法设计与实现第41-47页
        3.2.1 向量化方法设计与实现第41-43页
        3.2.2 内核算法的向量化第43-47页
    3.3 算法优化策略第47-51页
        3.3.1 双缓冲DMA策略第47-48页
        3.3.2 数据布局第48-49页
        3.3.3 软件流水第49-51页
        3.3.4 程序优化第51页
    3.4 测试结果及分析第51-53页
    3.5 本章小结第53-54页
第四章 Householder变换QR分解算法设计与实现第54-78页
    4.1 Householder变换算法基本原理第54-59页
        4.1.1 Householder变换矩阵的定义及其性质第54-55页
        4.1.2 算法原理第55-56页
        4.1.3 算法分析第56-59页
    4.2 Householder变换QR分解向量化方法设计与实现第59-67页
        4.2.1 Householder矩阵求值第60-64页
        4.2.2 矩阵乘法第64-67页
    4.3 算法优化策略第67-75页
        4.3.1 双缓冲DMA策略第67-68页
        4.3.2 数据布局第68-72页
        4.3.3 软件流水第72-74页
        4.3.4 程序优化第74-75页
    4.4 测试结果及分析第75-77页
    4.5 本章小结第77-78页
第五章 结束语第78-80页
    5.1 论文工作总结第78-79页
    5.2 未来研究展望第79-80页
致谢第80-82页
参考文献第82-85页
作者在学期间取得的学术成果第85页

论文共85页,点击 下载论文
上一篇:转BMP7基因组织工程软骨的构建与移植修复兔膝关节软骨缺损
下一篇:面向图搜索的流加速部件片上数据通路的设计、实现及性能优化