首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

全连接神经网络在FPGA上的实现与优化

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第15-23页
    1.1 研究背景第15-18页
        1.1.1 人工神经网络第15-16页
        1.1.2 全连接神经网络的发展与应用第16-17页
        1.1.3 搭载神经网络的硬件平台第17-18页
    1.2 全连接神经网络在FPGA上面临的挑战第18-19页
    1.3 本文的主要工作与目标第19-20页
        1.3.1 全连接神经网络的算法实现与优化第19-20页
        1.3.2 系统特征分析与优化第20页
    1.4 论文结构第20-23页
第2章 相关工作第23-29页
    2.1 FPGA架构第23页
    2.2 FPGA编程方式的发展第23-24页
    2.3 人工神经网络模型第24-26页
        2.3.1 从感知机到多隐层神经网络第24页
        2.3.2 全连接神经网络第24-25页
        2.3.3 卷积神经网络第25页
        2.3.4 循环神经网络第25-26页
    2.4 研究现状第26-28页
        2.4.1 利用硬件描述语言实现的网络第26-27页
        2.4.2 利用OpenCL实现的网络第27-28页
    2.5 本章小结第28-29页
第3章 全连接神经网络的算法实现与优化第29-51页
    3.1 OpenCL编程框架第29-30页
    3.2 FPGA异构平台的架构第30-32页
    3.3 OpenCL在FPGA系统上的开发模型第32-35页
        3.3.1 平台模型第32页
        3.3.2 执行模型第32-33页
        3.3.3 内存模型第33-35页
        3.3.4 编程模型第35页
    3.4 全连接操作算法分析第35页
    3.5 全连接层算法实现与优化第35-42页
        3.5.1 Merge Bias第35-36页
        3.5.2 分组设计第36-37页
        3.5.3 数据复用设计第37-42页
    3.6 激活函数算法分析第42-45页
        3.6.1 Sigmoid函数与tanh函数第42-44页
        3.6.2 ReLU函数第44-45页
    3.7 激活函数的实现与优化第45-48页
        3.7.1 Sigmoid函数与实现方法第45页
        3.7.2 泰勒级数法第45页
        3.7.3 查表法第45-46页
        3.7.4 分段函数逼近法第46-47页
        3.7.5 差分查表法第47-48页
    3.8 本章小结第48-51页
第4章 系统特征分析与优化第51-65页
    4.1 FPGA的访存机制第51-53页
        4.1.1 全局访存第51-52页
        4.1.2 本地存储第52页
        4.1.3 访存聚合第52页
        4.1.4 流式访存第52-53页
    4.2 数据传输优化第53-54页
        4.2.1 DMA技术第53-54页
        4.2.2 避免冗余数据传输第54页
        4.2.3 提高计算比重第54页
    4.3 存储访问优化第54-57页
        4.3.1 全局访存优化第54-56页
        4.3.2 全局存储的配置模式第56-57页
        4.3.3 本地访存优化第57页
    4.4 数据处理优化第57-63页
        4.4.1 多流水线机制第57-58页
        4.4.2 向量化第58-60页
        4.4.3 流水线复制第60页
        4.4.4 循环展开第60-61页
        4.4.5 平衡树第61-63页
        4.4.6 浮点数精度截取第63页
        4.4.7 半精设计第63页
    4.5 本章小结第63-65页
第5章 实验验证第65-73页
    5.1 实验环境第65页
        5.1.1 硬件平台第65页
        5.1.2 神经网络模型第65页
    5.2 算法设计与优化第65-67页
        5.2.1 分组划分第65-67页
        5.2.2 数据复用第67页
        5.2.3 激活函数优化第67页
    5.3 系统优化第67-69页
        5.3.1 数据传输优化第67-68页
        5.3.2 存储访问优化第68页
        5.3.3 循环展开和向量化第68-69页
        5.3.4 半精策略与流水线复制第69页
    5.4 对比第69-70页
    5.5 本章小结第70-73页
第6章 总结与展望第73-77页
    6.1 工作总结第73-74页
    6.2 工作展望第74-77页
参考文献第77-81页
致谢第81-83页
在读期间发表的学术论文与取得的研究成果第83-85页
在读期间参与的科研项目第85页

论文共85页,点击 下载论文
上一篇:RDPA:一种基于表型文本数据的疾病—表型关联预测算法
下一篇:基于深度学习的会话型推荐系统研究