基于GPU的FIR滤波并行化算法的研究与实现

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第11-15页
1.1 研究背景及意义	第11-12页
1.2 国内外研究现状	第12-13页
1.3 本文主要工作	第13-14页
1.4 本文的组织结构	第14-15页
第2章 GPU通用计算理论和CUDA简介	第15-29页
2.1 GPU通用计算概述	第15-18页
2.1.1 GPU的发展历程	第15-16页
2.1.2 从GPGPU到CUDA	第16-18页
2.2 CUDA简介	第18-23页
2.2.1 CUDA基础	第18-22页
2.2.2 CUDA的软件体系	第22-23页
2.3 GPU的硬件架构	第23-27页
2.4 CPU与GPU的比较	第27-28页
2.5 本章小结	第28-29页
第3章 FIR数字滤波器的原理	第29-35页
3.1 数字滤波器简介	第29-30页
3.2 FIR数字滤波器理论	第30-32页
3.3 FIR滤波器的设计方法	第32-34页
3.3.1 窗函数法简介	第32-33页
3.3.2 窗函数法的设计步骤	第33-34页
3.4 本章小结	第34-35页
第4章基于GPU实现FIR滤波	第35-55页
4.1 概述	第35页
4.2 基于Overlap-save方法的FIR滤波并行算法设计	第35-44页
4.2.1 算法分析	第35-37页
4.2.2 CPU与GPU的任务划分	第37-38页
4.2.3 Gird和Block维度设计	第38-39页
4.2.4 FIR滤波并行算法的实现	第39-42页
4.2.5 Kernel执行中算法的并发处理	第42-44页
4.3 FIR滤波并行算法的正确性验证	第44-49页
4.3.1 基于matlab设计512阶FIR低通滤波器	第44-48页
4.3.2 基于GPU实现的FIR滤波的结果	第48-49页
4.4 对于FIR滤波并行算法的优化	第49-53页
4.4.1 异步并行执行	第49-50页
4.4.2 优化过程	第50-53页
4.5 本章小结	第53-55页
第5章 FIR滤波并行算法的性能分析	第55-65页
5.1 实验平台	第55页
5.2 测试方法	第55-56页
5.3 算法的性能分析	第56-63页
5.3.1 加速比	第56-58页
5.3.2 I/O带宽的测定	第58-59页
5.3.3 浮点乘加运算能力	第59-60页
5.3.4 Block与SM的关系对计算性的影响	第60-62页
5.3.5 延迟	第62-63页
5.4 本章小结	第63-65页
第6章总结和展望	第65-67页
6.1 总结	第65-66页
6.2 展望	第66-67页
参考文献	第67-71页
致谢	第71页