首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于众核处理器的并行有限元方法研究及工程应用

摘要第4-6页
abstract第6-7页
第一章 绪论第11-22页
    1.1 引言第11-17页
        1.1.1 工程应用中的有限元方法和CAE技术第11-14页
        1.1.2 并行计算技术第14-17页
        1.1.3 基于众核处理器的CAE软件第17页
    1.2 研究内容第17-20页
        1.2.1 Delaunay三角化方法第18-19页
        1.2.2 稀疏线性方程组的求解第19-20页
    1.3 本文的结构安排第20-22页
第二章 众核处理器架构第22-30页
    2.1 硬件架构第22-24页
    2.2 软件编程框架第24-26页
    2.3 与GPU的对比第26-27页
    2.4 优化策略第27-28页
        2.4.1 并行度优化第27页
        2.4.2 存储优化第27-28页
        2.4.3 负载均衡第28页
    2.5 本章小结第28-30页
第三章 Delaunay三角剖分与线性方程组求解第30-44页
    3.1 Delaunay三角剖分第30-36页
        3.1.1 凸与三角化第30-32页
        3.1.2 Delaunay性质第32-36页
    3.2 稀疏矩阵存储格式第36-37页
    3.3 稀疏矩阵LU分解算法第37-41页
        3.3.1 关键步骤第37-39页
        3.3.2 Right-Looking串行算法第39-40页
        3.3.3 Left-Looking串行算法第40-41页
    3.4 共轭梯度算法和SpMv计算第41-43页
        3.4.1 共轭梯度算法第41-42页
        3.4.2 稀疏矩阵乘向量第42-43页
    3.5 本章小结第43-44页
第四章 基于众核处理器的并行Delaunay三角化研究第44-66页
    4.1 研究进展第44-48页
        4.1.1 串行Delaunay三角化第44-45页
        4.1.2 基于多核CPU的并行Delaunay三角化第45-46页
        4.1.3 基于GPU的Delaunay三角化第46-47页
        4.1.4 基于Xeon Phi处理器的Delaunay三角化算法第47-48页
    4.2 基础算法第48-54页
        4.2.1 组合优化问题第48-49页
        4.2.2 局部优化与局部极值第49-51页
        4.2.3 基础算法详细设计第51-54页
    4.3 改进算法第54-57页
        4.3.1 组合优化问题的改进第54-55页
        4.3.2 改进算法详细设计第55-57页
    4.4 并行化设计第57-61页
        4.4.1 支持并行化的数据结构第57-58页
        4.4.2 并行翻转第58-60页
        4.4.3 并行插入第60-61页
    4.5 实验结果与分析第61-65页
        4.5.1 实验环境第61-62页
        4.5.2 测试集第62页
        4.5.3 实验结果第62-65页
        4.5.4 实验分析第65页
    4.6 本章小结第65-66页
第五章 基于众核处理器的稀疏矩阵LU分解研究第66-82页
    5.1 研究进展第66-68页
        5.1.1 基于通用处理器的稀疏矩阵LU分解第66-67页
        5.1.2 基于FPGA的稀疏矩阵LU分解第67页
        5.1.3 基于GPU的稀疏矩阵LU分解第67-68页
        5.1.4 基于Xeon Phi的稀疏矩阵LU分解第68页
    5.2 并行LU分解算法设计第68-74页
        5.2.1 并行Right-looking算法设计第68-72页
        5.2.2 并行Left-looking算法设计第72-74页
    5.3 并行算法的优化第74-78页
        5.3.1 并行度优化第74-75页
        5.3.2 数据传输优化第75-76页
        5.3.3 存储器访问优化第76页
        5.3.4 向量化优化第76-77页
        5.3.5 负载均衡第77-78页
    5.4 实验与分析第78-80页
        5.4.1 测试集第78页
        5.4.2 加速比第78-79页
        5.4.3 内存带宽利用率第79-80页
    5.5 本章小结第80-82页
第六章 基于众核处理器的并行共轭梯度算法研究第82-98页
    6.1 研究进展第82-84页
        6.1.1 通用处理器的稀疏矩阵向量乘第82-83页
        6.1.2 FPGA上的稀疏矩阵向量乘第83页
        6.1.3 GPU上的稀疏矩阵向量乘第83页
        6.1.4 Xeon Phi的稀疏矩阵向量乘第83-84页
    6.2 性能分析第84-86页
    6.3 Xeon Phi处理器的Roofline模型第86-89页
        6.3.1 计算密度第86-87页
        6.3.2 Phi处理器的硬件性能第87页
        6.3.3 完整的模型第87-89页
    6.4 并行SpMV算法设计第89-93页
        6.4.1 分段块CSR存储格式第89-91页
        6.4.2 基于分段CSR存储格式的串行算法第91-92页
        6.4.3 基于分段CSR存储格式的并行算法第92-93页
        6.4.4 并行CG算法第93页
    6.5 实验结果与分析第93-96页
        6.5.1 测试集第93-94页
        6.5.2 性能加速比第94-95页
        6.5.3 内存带宽利用第95-96页
        6.5.4 分块大小对性能的影响第96页
    6.6 本章小结第96-98页
第七章 结论与展望第98-100页
    7.1 本文主要创新点第98-99页
    7.2 进一步研究展望第99-100页
参考文献第100-108页
攻读学位期间所取得的相关科研成果第108-110页
致谢第110页

论文共110页,点击 下载论文
上一篇:我国产能过剩与银行流动性研究
下一篇:65纳米以下IC碱性阻挡层CMP材料与工艺的研究