首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于CUDA的信号处理基本模块优化实现

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-14页
第一章 绪论第14-20页
    1.1 研究背景第14-16页
        1.1.1 单核解决方案的局限性第14-15页
        1.1.2 众核GPU通用计算崛起第15-16页
    1.2 并行计算及其应用第16-18页
        1.2.1 并行计算第16-17页
        1.2.2 并行应用的发展现状第17-18页
    1.3 本文主要工作及内容安排第18-20页
第二章 GPU硬件架构及CUDA软件体系第20-32页
    2.1 众核GPU硬件架构第20-22页
    2.2 CUDA软件体系第22-26页
        2.2.1 CUDA软件架构第22-23页
        2.2.2 CUDA语法介绍第23-24页
        2.2.3 CUDA编程模型第24-25页
        2.2.4 CUDA执行模型第25-26页
    2.3 CUDA存储器模型第26-29页
    2.4 CUDA程序优化策略第29-31页
        2.4.1 CUDA程序优化方向第29-30页
        2.4.2 CUDA程序性能指标第30-31页
        2.4.3 CUDA程序性能优化第31页
    2.5 本章小结第31-32页
第三章 矩阵基本运算CUDA优化实现第32-50页
    3.1 矩阵相乘CUDA优化实现第32-42页
        3.1.1 矩阵相乘概述第32-33页
        3.1.2 矩阵相乘带状实现第33-34页
        3.1.3 棋盘阵列矩阵乘法实现一第34-36页
        3.1.4 棋盘阵列矩阵乘法实现二第36-38页
        3.1.5 CUBLAS库实现矩阵相乘第38-39页
        3.1.6 矩阵相乘仿真分析第39-42页
    3.2 矩阵求逆的优化实现第42-49页
        3.2.1 矩阵求逆概述第42-43页
        3.2.2 矩阵求逆CUDA实现第43-47页
        3.2.3 矩阵求逆CUDA优化第47-48页
        3.2.4 矩阵求逆仿真分析第48-49页
    3.3 本章小结第49-50页
第四章 基于CUDA的FFT并行优化实现第50-66页
    4.1 离散傅里叶变换的概述第50-51页
    4.2 FFT的基本思想第51-57页
        4.2.1 DIT-FFT算法的基本原理第51-54页
        4.2.2 运算量对比第54-55页
        4.2.3 DIT-FFT的运算规律第55-57页
    4.3 基于CUDA的FFT算法实现第57-60页
        4.3.1 倒位序的实现第57-58页
        4.3.2 FFT并行实现第58-60页
    4.4 基于CUDA的FFT算法的优化第60-62页
    4.5 CUFFT实现FFT运算第62-63页
    4.6 FFT仿真分析第63-64页
    4.7 本章小结第64-66页
第五章 总结与展望第66-68页
    5.1 本文工作总结第66-67页
    5.2 工作展望第67-68页
参考文献第68-72页
致谢第72-74页
作者简介第74-75页

论文共75页,点击 下载论文
上一篇:A Study of Two English Versions of Tao Te Ching from the Perspective of Fusion of Horizons
下一篇:On Translation of Shaanxi Dialect under The Relevance Theory