首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于GPU的FIR滤波并行化算法的研究与实现

摘要第5-6页
Abstract第6-7页
第1章 绪论第11-15页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-13页
    1.3 本文主要工作第13-14页
    1.4 本文的组织结构第14-15页
第2章 GPU通用计算理论和CUDA简介第15-29页
    2.1 GPU通用计算概述第15-18页
        2.1.1 GPU的发展历程第15-16页
        2.1.2 从GPGPU到CUDA第16-18页
    2.2 CUDA简介第18-23页
        2.2.1 CUDA基础第18-22页
        2.2.2 CUDA的软件体系第22-23页
    2.3 GPU的硬件架构第23-27页
    2.4 CPU与GPU的比较第27-28页
    2.5 本章小结第28-29页
第3章 FIR数字滤波器的原理第29-35页
    3.1 数字滤波器简介第29-30页
    3.2 FIR数字滤波器理论第30-32页
    3.3 FIR滤波器的设计方法第32-34页
        3.3.1 窗函数法简介第32-33页
        3.3.2 窗函数法的设计步骤第33-34页
    3.4 本章小结第34-35页
第4章 基于GPU实现FIR滤波第35-55页
    4.1 概述第35页
    4.2 基于Overlap-save方法的FIR滤波并行算法设计第35-44页
        4.2.1 算法分析第35-37页
        4.2.2 CPU与GPU的任务划分第37-38页
        4.2.3 Gird和Block维度设计第38-39页
        4.2.4 FIR滤波并行算法的实现第39-42页
        4.2.5 Kernel执行中算法的并发处理第42-44页
    4.3 FIR滤波并行算法的正确性验证第44-49页
        4.3.1 基于matlab设计512阶FIR低通滤波器第44-48页
        4.3.2 基于GPU实现的FIR滤波的结果第48-49页
    4.4 对于FIR滤波并行算法的优化第49-53页
        4.4.1 异步并行执行第49-50页
        4.4.2 优化过程第50-53页
    4.5 本章小结第53-55页
第5章 FIR滤波并行算法的性能分析第55-65页
    5.1 实验平台第55页
    5.2 测试方法第55-56页
    5.3 算法的性能分析第56-63页
        5.3.1 加速比第56-58页
        5.3.2 I/O带宽的测定第58-59页
        5.3.3 浮点乘加运算能力第59-60页
        5.3.4 Block与SM的关系对计算性的影响第60-62页
        5.3.5 延迟第62-63页
    5.4 本章小结第63-65页
第6章 总结和展望第65-67页
    6.1 总结第65-66页
    6.2 展望第66-67页
参考文献第67-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:二十世纪六、七十年代中国音乐思潮中的王建中钢琴创作--以王建中钢琴改编曲《陕北民歌四首》为例
下一篇:大学生外显自尊、内隐自尊与自我表露的关系研究