首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于OpenCL的目标检测算法加速

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-15页
第一章 绪论第15-21页
    1.1 研究背景和选题意义第15页
    1.2 国内外研究现状第15-17页
        1.2.1 目标检测国内外研究现状第15-16页
        1.2.2 OpenCL并行处理国内外研究现状第16-17页
    1.3 本文内容与创新第17-18页
    1.4 本文结构安排第18-21页
第二章 YOLO目标检测算法与OpenCL语言规范第21-33页
    2.1 YOLO目标检测算法第21-27页
        2.1.1 YOLO目标检测算法简介第21-22页
        2.1.2 YOLO目标检测算法训练过程第22-25页
        2.1.3 YOLO目标检测算法测试过程第25-26页
        2.1.4 YOLO目标检测算法对比结果及不足第26-27页
    2.2 OpenCL语言规范第27-31页
    2.3 并行计算设备第31-33页
        2.3.1 GPU第31页
        2.3.2 MIC第31-32页
        2.3.3 FPGA第32-33页
第三章 基于OpenCL的YOLO目标检测算法第33-47页
    3.1 YOLO目标检测算法并行模式框架第33-35页
        3.1.1 平台初始化第34页
        3.1.2 程序及内存对象初始化第34-35页
    3.2 内核函数设计第35-42页
        3.2.1 卷积层内核函数设计第35-41页
        3.2.2 最大池化层内核函数设计第41-42页
        3.2.3 Softmax层内核函数设计第42页
    3.3 实验结果与分析第42-45页
        3.3.1 实验环境第42页
        3.3.2 实验数据第42-43页
        3.3.3 结果验证第43页
        3.3.4 并行算法评价指标第43页
        3.3.5 实验内容第43-45页
    3.4 本章小结第45-47页
第四章 YOLO目标检测算法优化第47-59页
    4.1 并行算法优化方法第47-49页
        4.1.1 NDrange优化第47页
        4.1.2 全局存储器优化第47-48页
        4.1.3 局部存储器优化第48页
        4.1.4 优化指令集第48-49页
    4.2 矩阵乘法优化第49-55页
        4.2.1 局部存储器分块第50-51页
        4.2.2 线程多任务第51-53页
        4.2.3 二维寄存器分块第53-55页
    4.3 实验结果及分析第55-58页
        4.3.1 矩阵乘法运行效率对比第56页
        4.3.2 矩阵乘法运算能力对比第56-57页
        4.3.3 优化后YOLO目标检测算法运行时间对比第57-58页
    4.4 本章小结第58-59页
第五章 多平台YOLO算法对比实验第59-67页
    5.1 基于FPGA的YOLO目标检测算法第59-63页
        5.1.1 FPGA OpenCL内核编译流程第59-60页
        5.1.2 FPGA OpenCL内核优化第60-61页
        5.1.3 基于FPGA的YOLO内核优化第61-63页
    5.2 多平台YOLO算法实验对比第63-65页
        5.2.1 实验环境第63页
        5.2.2 多平台YOLO目标检测算法测试性能第63-64页
        5.2.3 多平台YOLO目标检测算法训练性能第64-65页
    5.3 本章小结第65-67页
第六章 总结与展望第67-69页
    6.1 研究总结第67-68页
    6.2 研究展望第68-69页
参考文献第69-73页
致谢第73-75页
作者简介第75-76页

论文共76页,点击 下载论文
上一篇:面向星载图像压缩系统的地面检测设备设计
下一篇:具有不可观察事件的最大—加自动机的状态估计和故障诊断