首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于申威处理器的PETSc异构并行算法设计和研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第12-19页
    1.1 研究背景和意义第12-13页
    1.2 国内外研究现状第13-17页
        1.2.1 PETSc研究现状第13-15页
        1.2.2 神威·太湖之光研究现状第15-16页
        1.2.3 相关工作介绍第16-17页
    1.3 本文主要工作第17-18页
        1.3.1 PETSc工具箱学习和神威系统研究第17页
        1.3.2 PETSc工具箱在神威·太湖之光上的移植和优化第17-18页
        1.3.3 本文的创新点第18页
    1.4 论文组织结构第18-19页
第2章 PETSc工具箱相关介绍第19-29页
    2.1 PETSc工具箱简介第19-22页
        2.1.1 PETSc概况第19页
        2.1.2 PETSc体系结构第19-21页
        2.1.3 PETSc基本特色第21-22页
    2.2 PETSc数据结构组件第22-25页
        2.2.1 向量Vec第22-24页
        2.2.2 矩阵Mat第24-25页
    2.3 PETSc方程求解器第25-27页
    2.4 PETSc程序结构第27页
    2.5 PETSc编译和使用第27-28页
    2.6 本章小结第28-29页
第3章 神威·太湖之光系统体系结构第29-37页
    3.1 申威处理器系结构第29-31页
        3.1.1 处理器架构第29-30页
        3.1.2 主核基础性能第30页
        3.1.3 从核基础性能第30-31页
    3.2 神威体系结构第31-33页
    3.3 语言环境第33-34页
    3.4 编译器介绍第34-35页
    3.5 主从核设计引发的思考第35-36页
    3.6 本章小结第36-37页
第4章 PETSc在申威处理器上的移植和部分核心函数的优化第37-62页
    4.1 PETSc移植第37-40页
    4.2 函数分类第40页
    4.3 并行算法设计第40-48页
        4.3.1 并行模式第41-42页
        4.3.2 VecMdot函数算法设计第42-45页
        4.3.3 MatMult函数算法设计第45-48页
    4.4 优化方法介绍第48-60页
        4.4.1 编译优化第48-49页
        4.4.2 众核访存优化第49-55页
        4.4.3 向量化优化第55-58页
        4.4.4 通信优化第58-60页
    4.5 具体优化实现第60-61页
    4.6 本章小结第61-62页
第5章 实验结果对比第62-69页
    5.1 从核性能测试结果第62页
    5.2 单节点测试结果第62-63页
    5.3 多节点测试结果第63-65页
    5.4 相关工作对比第65-68页
    5.5 本章小结第68-69页
结论第69-71页
参考文献第71-75页
致谢第75-76页
附录 A 攻读硕士学位期间所发表的学术论文目录第76-77页
附录 B 攻读硕士学位期间所参与的学术科研活动第77页

论文共77页,点击 下载论文
上一篇:基于太湖之光的可扩展分子模拟算法研究与实现
下一篇:小学数学教学中的微课设计与应用研究--以A小学为例