首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于BWDSP的众核深度学习加速器的研究

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第15-25页
    1.1 研究背景第15-22页
        1.1.1 深度学习第15-17页
        1.1.2 众核深度学习加速器第17-20页
        1.1.3 片上互连第20-22页
    1.2 研究问题和研究意义第22页
    1.3 论文的主要工作第22-23页
    1.4 论文组织第23-25页
第2章 BWDSP的深度学习计算算法的优化第25-39页
    2.1 BWDSP体系结构第25-26页
    2.2 卷积神经网络第26-28页
    2.3 基于多簇体系结构的深度学习算法第28-33页
        2.3.1 基于多簇体体系结构的卷积计算算法第28-31页
        2.3.2 双总线的读取带宽的优化第31-32页
        2.3.3 常见卷积层计算算法第32-33页
    2.4 基于特定网络层参数的自动代码生成第33-35页
        2.4.1 卷积神经网络模型的特点第33页
        2.4.2 代码自动生成的优化措施第33-35页
    2.5 实验结果与分析第35-37页
    2.6 本章小结第37-39页
第3章 深度学习众核计算算法的研究与优化第39-53页
    3.1 众核计算模型第39-41页
    3.2 深度学习众核计算算法第41-46页
        3.2.1 卷积层第41-44页
        3.2.2 全连接层第44-45页
        3.2.3 网络层融合技术的扩展第45-46页
    3.3 计算任务划分工具Scheduler第46-47页
    3.4 实验结果与分析第47-51页
    3.5 本章小结第51-53页
第4章 众核深度学习加速器众核互连的研究第53-65页
    4.1 众核深度学习加速器的结构第53-54页
    4.2 基于CNN众核计算算法的众核互连第54-55页
    4.3 轮转三缓冲区第55-57页
    4.4 实验分析工具第57页
    4.5 实验结果与分析第57-63页
    4.6 本章小结第63-65页
第5章 总结与展望第65-69页
    5.1 工作总结第65-66页
    5.2 本文的贡献和创新点第66-67页
    5.3 工作展望第67-69页
参考文献第69-74页
致谢第74-75页
在读期间发表的学术论文与取得的研究成果第75-76页
在读期间参与的科研项目第76页

论文共76页,点击 下载论文
上一篇:梯度下降法在机器学习中的应用
下一篇:基于激光雷达的移动探测机器人的设计