首页--数理科学和化学论文--计算数学论文--数值分析论文--线性代数的计算方法论文

基于异构系统的三对角矩阵求解器的研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-15页
    1.1 研究目的和意义第9-10页
    1.2 国内外研究现状第10-12页
    1.3 论文研究内容及组织结构第12-15页
        1.3.1 论文研究内容第12页
        1.3.2 论文组织结构第12-15页
第2章 GPU结构与矩阵求解算法分析第15-27页
    2.1 GPU结构第15-16页
    2.2 串行三对角矩阵求解算法第16-18页
        2.2.1 Thomas算法第16-18页
        2.2.2 对角主元算法第18页
    2.3 并行三对角矩阵求解算法第18-24页
        2.3.1 并行连分数-LU算法第18-20页
        2.3.2 循环规约算法第20-22页
        2.3.3 SPIKE算法第22-24页
    2.4 算法比较与分析第24-25页
    2.5 本章小结第25-27页
第3章 T-SCG求解器设计第27-39页
    3.1 SPIKE~2算法第27-30页
    3.2 简化的SPIKE算法第30-31页
    3.3 T-SCG求解器第31-35页
    3.4 基于T-SCG求解器的扩展算法第35-36页
        3.4.1 SPIKE~2-Thomas算法第35页
        3.4.2 SPIKE~2-CR算法第35-36页
    3.5 存储性能、通信量及功耗分析第36页
    3.6 本章小结第36-39页
第4章 T-SCG求解器优化第39-45页
    4.1 数据布局转换第39-41页
    4.2 常量内存的利用第41-42页
    4.3 核函数融合机制第42-44页
    4.4 本章小结第44-45页
第5章 实验验证第45-55页
    5.1 实验平台与环境第45-47页
        5.1.1 CUDA平台简介第45-46页
        5.1.2 实验环境第46-47页
    5.2 关键性能测试与分析第47-52页
        5.2.1 数值稳定性第47-50页
        5.2.2 单节点性能第50-52页
    5.3 本章小结第52-55页
结论第55-57页
参考文献第57-61页
攻读硕士学位期间发表的论文和取得的科研成果第61-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:浮动车数据与城市区域活跃程度的关联性分析与建模
下一篇:成都A公司采血产品营销策略研究