基于查找表的FFT CUDA并行算法研究

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第12-18页
1.1 研究背景	第12-13页
1.2 国内外研究现状	第13-16页
1.2.1 快速傅里叶变换的研究与发展	第13-15页
1.2.2 GPU通用计算的研究与发展	第15-16页
1.3 本文研究内容	第16-17页
1.4 本文组织结构	第17-18页
第2章相关理论与研究	第18-35页
2.1 GPU架构	第18-26页
2.1.1 CUDA编程模型	第18-24页
2.1.2 纹理存储器具体使用方法	第24-26页
2.2 快速傅里叶变换算法	第26-33页
2.2.1 离散傅里叶变换	第26页
2.2.2 旋转因子	第26-27页
2.2.3 快速傅里叶变换	第27-33页
2.3 查找表	第33-34页
2.4 小结	第34-35页
第3章并行FFT算法设计与优化	第35-45页
3.1 快速傅里叶串行算法	第35-36页
3.2 FFT算法并行设计	第36-37页
3.2.1 FFT算法并行可行性分析	第36页
3.2.2 旋转因子并行设计	第36-37页
3.2.3 任务划分	第37页
3.3 FFT在GPU CUDA上的并行算法	第37-39页
3.3.1 GPU程序的执行步骤	第37-38页
3.3.2 并行FFIT算法执行步骤	第38-39页
3.4 基于CUDA的并行优化	第39-43页
3.4.1 线程结构优化	第39-41页
3.4.2 CUDA程序优化	第41-42页
3.4.3 旋转因子存储优化	第42-43页
3.5 多GPU上的并行FFT	第43-44页
3.6 小结	第44-45页
第4章基于CUDA的FFT算法实现	第45-56页
4.1 实验平台搭建	第45-46页
4.1.1 设备参数	第45页
4.1.2 CPU+GPU异构平台合作	第45-46页
4.2 并行快速傅里叶算法具体实现	第46-48页
4.2.1 倒位序算法实现	第46-47页
4.2.2 基于一维纹理内存的FFT	第47-48页
4.2.3 基于二维纹理内存的FFT	第48页
4.3 实验结果分析	第48-55页
4.3.1 单GPU上程序运行	第49-52页
4.3.2 多GPU上程序运行	第52-55页
4.4 小结	第55-56页
结论	第56-58页
参考文献	第58-62页
附录A 攻读硕士学位期间所发表的学术论文目录	第62-63页
附录B 攻读学位期间所参加的科研项目目录	第63-64页
致谢	第64页