首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于多核DSP的深度学习算法硬件加速技术研究

摘要第9-10页
ABSTRACT第10页
第一章 前言第11-19页
    1.1 课题研究背景第11-12页
    1.2 课题研究现状第12-16页
        1.2.1 DSP技术研究及其应用现状第12-14页
        1.2.2 深度学习技术研究及其应用现状第14-15页
        1.2.3 面向深度学习领域的硬件加速技术研究现状第15-16页
    1.3 课题研究内容第16-18页
        1.3.1 低功耗多级并行DSP系统体系结构第17页
        1.3.2 面向深度信念网络的并行优化技术第17页
        1.3.3 面向卷积神经网络的并行优化技术第17页
        1.3.4 面向深度学习算法的编程框架技术第17-18页
    1.4 论文组织结构第18-19页
第二章 低功耗多级并行DSP系统体系结构第19-32页
    2.1 系统概述第19-21页
        2.1.1 总体结构第19页
        2.1.2 并行机制第19-21页
    2.2 主要硬件资源第21-26页
        2.2.1 芯片和互连第21-22页
        2.2.2 存储和编址第22-23页
        2.2.3 EDMA3第23-24页
        2.2.4 HyperLink第24-26页
    2.3 基础数学库第26-28页
        2.3.1 向量的点积第26页
        2.3.2 向量的加法第26-27页
        2.3.3 矩阵的转置第27页
        2.3.4 矩阵的乘法第27页
        2.3.5 快速傅里叶变换第27-28页
    2.4 支持存算并发的PingPong模型第28-31页
        2.4.1 读模型第28-29页
        2.4.2 写模型第29-30页
        2.4.3 读写模型第30-31页
    2.5 本章小结第31-32页
第三章 面向深度信念网络的并行优化技术第32-46页
    3.1 DBN简介第32-35页
    3.2 单片DSP的并行优化第35-40页
        3.2.1 单片DSP并行计算h1第35-37页
        3.2.2 单片DSP并行计算c1第37-38页
        3.2.3 单片DSP并行计算v2第38-39页
        3.2.4 单片DSP并行更新网络权值第39-40页
    3.3 双片DSP的并行优化第40-43页
        3.3.1 双片DSP并行计算h1第41页
        3.3.2 双片DSP并行计算c1第41-42页
        3.3.3 双片DSP并行计算v2第42-43页
        3.3.4 双片DSP并行更新网络权值第43页
    3.4 实验设置与结果分析第43-45页
    3.5 本章小结第45-46页
第四章 面向卷积神经网络的并行优化技术第46-63页
    4.1 CNN简介第46-48页
    4.2 卷积计算的优化方法第48-54页
        4.2.1 卷积转化为FFT第48-51页
        4.2.2 卷积转化为矩阵乘第51-53页
        4.2.3 实验设置与结果分析第53-54页
    4.3 多核并行卷积计算的优化方法第54-62页
        4.3.1 粗粒度并行的卷积计算方法第54-57页
        4.3.2 细粒度并行的卷积计算方法第57-59页
        4.3.3 实验设置与结果分析第59-62页
    4.4 本章小结第62-63页
第五章 面向深度学习算法的编程框架技术第63-73页
    5.1 Caffe简介第63页
    5.2 深度学习算法模块的硬件加速技术第63-67页
        5.2.1 FullC层第64-65页
        5.2.2 Pooling层第65-66页
        5.2.3 LRN层第66-67页
        5.2.4 softmax层第67页
    5.3 实验设置与结果分析第67-72页
        5.3.1 Cifar-10的实现第68-69页
        5.3.2 AlexNet的实现第69-71页
        5.3.3 VGG-s的实现第71-72页
    5.4 本章小结第72-73页
第六章 总结与展望第73-75页
    6.1 工作总结第73-74页
    6.2 研究展望第74-75页
致谢第75-76页
参考文献第76-82页
作者在学期间取得的学术成果第82页

论文共82页,点击 下载论文
上一篇:基于惯性导航的室内定位技术研究
下一篇:基于区域卷积神经网络的目标检测方法研究