首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于查找表的FFT CUDA并行算法研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第12-18页
    1.1 研究背景第12-13页
    1.2 国内外研究现状第13-16页
        1.2.1 快速傅里叶变换的研究与发展第13-15页
        1.2.2 GPU通用计算的研究与发展第15-16页
    1.3 本文研究内容第16-17页
    1.4 本文组织结构第17-18页
第2章 相关理论与研究第18-35页
    2.1 GPU架构第18-26页
        2.1.1 CUDA编程模型第18-24页
        2.1.2 纹理存储器具体使用方法第24-26页
    2.2 快速傅里叶变换算法第26-33页
        2.2.1 离散傅里叶变换第26页
        2.2.2 旋转因子第26-27页
        2.2.3 快速傅里叶变换第27-33页
    2.3 查找表第33-34页
    2.4 小结第34-35页
第3章 并行FFT算法设计与优化第35-45页
    3.1 快速傅里叶串行算法第35-36页
    3.2 FFT算法并行设计第36-37页
        3.2.1 FFT算法并行可行性分析第36页
        3.2.2 旋转因子并行设计第36-37页
        3.2.3 任务划分第37页
    3.3 FFT在GPU CUDA上的并行算法第37-39页
        3.3.1 GPU程序的执行步骤第37-38页
        3.3.2 并行FFIT算法执行步骤第38-39页
    3.4 基于CUDA的并行优化第39-43页
        3.4.1 线程结构优化第39-41页
        3.4.2 CUDA程序优化第41-42页
        3.4.3 旋转因子存储优化第42-43页
    3.5 多GPU上的并行FFT第43-44页
    3.6 小结第44-45页
第4章 基于CUDA的FFT算法实现第45-56页
    4.1 实验平台搭建第45-46页
        4.1.1 设备参数第45页
        4.1.2 CPU+GPU异构平台合作第45-46页
    4.2 并行快速傅里叶算法具体实现第46-48页
        4.2.1 倒位序算法实现第46-47页
        4.2.2 基于一维纹理内存的FFT第47-48页
        4.2.3 基于二维纹理内存的FFT第48页
    4.3 实验结果分析第48-55页
        4.3.1 单GPU上程序运行第49-52页
        4.3.2 多GPU上程序运行第52-55页
    4.4 小结第55-56页
结论第56-58页
参考文献第58-62页
附录A 攻读硕士学位期间所发表的学术论文目录第62-63页
附录B 攻读学位期间所参加的科研项目目录第63-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:基于连通性监测的垂直切换方法研究
下一篇:相干光OFDM通信系统中克服激光器相位噪声的关键技术研究