首页--数理科学和化学论文--计算数学论文--数值分析论文--线性代数的计算方法论文

基于CUDA的并行PCG方法自动生成系统研究与实现

摘要第5-6页
abstract第6页
第1章 绪论第9-15页
    1.1 课题研究的背景和意义第9-10页
    1.2 国内外研究现状及趋势第10-12页
        1.2.1 并行SpMV算法的研究第10-11页
        1.2.2 并行PCG算法的研究第11页
        1.2.3 SpMV性能评估的研究第11-12页
    1.3 研究内容第12-13页
    1.4 论文章节安排第13-15页
第2章 相关技术及PCG并行优化框架第15-24页
    2.1 CUDA介绍第15-18页
        2.1.1 CUDA并行计算第15-16页
        2.1.2 CUDA编程模型第16-17页
        2.1.3 CUDA存储器模型第17-18页
    2.2 稀疏矩阵存储格式第18-20页
        2.2.1 COO存储格式第18页
        2.2.2 CSR存储格式第18-19页
        2.2.3 DIA存储格式第19页
        2.2.4 ELL存储格式第19页
        2.2.5 HYB存储格式第19-20页
    2.3 PCG算法第20-22页
    2.4 PCG并行优化框架第22-23页
    2.5 本章小结第23-24页
第3章 矢量运算和矢量内积并行优化性能模型研究第24-32页
    3.1 矢量运算的并行优化性能模型第24-27页
        3.1.1 获取GPU特性第24页
        3.1.2 核模型第24-25页
        3.1.3 实验设置第25页
        3.1.4 并行优化性能模型的构建第25-26页
        3.1.5 生成决策树第26-27页
    3.2 矢量内积的并行优化性能模型第27-30页
        3.2.1 获取GPU特性第28页
        3.2.2 核模型第28页
        3.2.3 实验设置第28页
        3.2.4 并行优化性能模型的构建第28-30页
        3.2.5 生成决策树第30页
    3.3 本章小结第30-32页
第4章 SpMV和预条件子的并行优化性能模型研究第32-43页
    4.1 SpMV的并行优化性能模型第32-41页
        4.1.1 获取GPU特性第32-33页
        4.1.2 核模型第33页
        4.1.3 实验设置第33-35页
        4.1.4 并行优化性能模型建立第35-40页
        4.1.5 自动选择最优核函数算法第40-41页
    4.2 预条件子并行算法以及并行优化性能模型第41-42页
    4.3 本章小结第42-43页
第5章 系统实现与实验比较第43-61页
    5.1 系统设计与图形化交互建模第43-51页
        5.1.1 系统设计第43-45页
        5.1.2 图形化交互建模第45-51页
    5.2 实验比较第51-59页
        5.2.1 测试矢量运算、矢量内积决策树的有效性第51-53页
        5.2.2 测试SpMV并行优化性能模型预测核函数执行时间的精准度第53-56页
        5.2.3 测试自动选择最优核函数算法选择最优核函数的精准度第56-57页
        5.2.4 自动生成的并行PCG方法性能测试第57-59页
    5.3 本章小结第59-61页
第6章 结论与展望第61-63页
    6.1 结论第61-62页
    6.2 展望第62-63页
参考文献第63-67页
致谢第67-68页
攻读学位期间参加的科研项目和成果第68页

论文共68页,点击 下载论文
上一篇:人寿保险公司再保险系统的设计与实现
下一篇:京海黄鸡脂肪沉积关键基因的筛选