首页--数理科学和化学论文--计算数学论文--数值并行计算论文

CPU+GPU异构平台上稀疏线性系统快速并行求解算法研究

摘要第5-7页
Abstract第7-9页
第1章 绪论第17-24页
    1.1 研究背景及意义第17-18页
    1.2 国内外研究现状第18-21页
        1.2.1 大规模异构计算机系统的发展现状第18-19页
        1.2.2 高阶线性系统求解算法的研究现状第19-20页
        1.2.3 异构计算环境协同并行编程研究现状第20-21页
    1.3 面临的挑战第21页
    1.4 研究目标和研究内容第21-23页
        1.4.1 研究目标第21-22页
        1.4.2 研究内容第22-23页
    1.5 本文组织结构第23-24页
第2章 相关理论与研究第24-43页
    2.1 稀疏线性方程组的求解算法第24-31页
        2.1.1 直接求解算法第25-30页
        2.1.2 迭代求解算法第30-31页
    2.2 稀疏矩阵的存储格式第31-34页
        2.2.1 COO存储格式第31-32页
        2.2.2 CSR存储格式第32页
        2.2.3 ELL存储格式第32-33页
        2.2.4 DIA存储格式第33页
        2.2.5 HYB存储格式第33页
        2.2.6 BSR存储格式第33-34页
    2.3 稀疏矩阵与向量乘(SpMV)第34-35页
    2.4 CPU+GPU异构编程模型第35-42页
        2.4.1 GPGPU架构第35-38页
        2.4.2 CUDA介绍第38-39页
        2.4.3 CPU多核架构第39-40页
        2.4.4 OpenMP介绍第40-41页
        2.4.5 CPU+GPU异构协同计算第41-42页
    2.5 本章小结第42-43页
第3章 CPU+GPU异构平台上的SpMV自适应计算第43-69页
    3.1 引言第43-44页
    3.2 研究现状第44-46页
        3.2.1 采用不同压缩格式的实现第44-45页
        3.2.2 基于GPU的SpMV的性能建模和预测第45-46页
    3.3 SpMV性能建模第46-55页
        3.3.1 分布密度模型第46-48页
        3.3.2 稀疏矩阵压缩格式的空间复杂度分析第48-49页
        3.3.3 SpMV的性能分析第49-55页
    3.4 SpMV在GPU上的自适应优化第55-57页
    3.5 实验评价第57-67页
        3.5.1 实验环境配置第57-60页
        3.5.2 性能的预测与测试第60-67页
    3.6 本章小结第67-69页
第4章 CPU+GPU异构平台上SpMV的分块计算第69-97页
    4.1 引言第69-70页
    4.2 研究现状第70-72页
        4.2.1 GPU和多核CPU上SpMV的并行实现第70页
        4.2.2 SpMV的分块并行计算第70-72页
    4.3 基于行向量块的分布密度模型第72-73页
        4.3.1 行向量块分布密度模型的数值特征第72-73页
    4.4 分割算法第73-78页
        4.4.1 构建稀疏矩阵的分布密度模型的样例第73页
        4.4.2 稀疏矩阵的分割策略第73-78页
    4.5 性能分析第78-83页
        4.5.1 稀疏矩阵的分割优化分析第79-81页
        4.5.2 执行时间分析第81-82页
        4.5.3 CPU和GPU计算性能分析第82-83页
    4.6 算法实现与实验分析第83-96页
        4.6.1 GPU和CPU混合并行编程第83-85页
        4.6.2 基于分割算法SpMV的并行实现第85-86页
        4.6.3 实验配置第86-89页
        4.6.4 SpMV测试和性能评价第89-96页
    4.7 本章小结第96-97页
第5章 准三对角线性方程组的快速并行求解算法第97-123页
    5.1 引言第97-98页
        5.1.1 动机第97-98页
        5.1.2 主要贡献第98页
    5.2 研究现状第98-99页
    5.3 准三对角线性方程组的求解算法第99-104页
        5.3.1 准三对角矩阵的分解第99-100页
        5.3.2 混合迭代求解算法(HISA)第100-101页
        5.3.3 迭代收敛性分析第101-102页
        5.3.4 计算复杂性分析第102-103页
        5.3.5 存储空间分析第103-104页
    5.4 针对HISA算法中CR方法的并行实现第104-112页
        5.4.1 循环约简法第104-108页
        5.4.2 基于分块的HISA算法(BHISA)第108-111页
        5.4.3 GPU上并行求解算法的优化第111-112页
    5.5 实验评价第112-121页
        5.5.1 实验配置第112-115页
        5.5.2 收敛性测试第115-116页
        5.5.3 性能评价第116-121页
    5.6 本章小结第121-123页
第6章 块三对角线性方程组的快速并行求解及其应用第123-138页
    6.1 引言第123页
    6.2 研究现状第123-124页
    6.3 块三对角线性方程组的求解方法第124-130页
        6.3.1 块三对角矩阵第124-125页
        6.3.2 块三对角矩阵的分块第125页
        6.3.3 混合分块迭代求解算法第125-128页
        6.3.4 迭代过程的收敛性分析第128-129页
        6.3.5 算法的并行实现第129-130页
    6.4 案例研究: 云资源调度第130-137页
        6.4.1 M/M/n+k动态排队模型第131-133页
        6.4.2 块三对角矩阵的混合存储格式第133-134页
        6.4.3 实验评价第134-137页
    6.5 本章小结第137-138页
结论第138-141页
参考文献第141-149页
附录A 发表论文和参加科研情况说明第149-151页
附录B 攻读学位期间所参加的科研项目及申请的专利第151-152页
致谢第152页

论文共152页,点击 下载论文
上一篇:复杂网络上的信息有效传播研究
下一篇:张量特征值的估计与张量广义逆