首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

多GPU环境下的卷积神经网络并行算法

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-17页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-15页
        1.2.1 调整训练算法第12-13页
        1.2.2 硬件加速第13-14页
        1.2.3 多GPU并行加速第14-15页
    1.3 本文的研究内容第15-16页
    1.4 本文的组织结构第16-17页
第二章 技术背景第17-31页
    2.1 人工神经网络第18-20页
    2.2 卷积神经网络第20-25页
        2.2.1 卷积神经网络模型第20-22页
        2.2.2 卷积神经网络特点第22-23页
        2.2.3 卷积神经网络模型训练第23-25页
    2.3 GPU的体系结构第25-26页
    2.4 CUDA第26-29页
        2.4.1 线程结构第27页
        2.4.2 存储结构第27-29页
    2.5 本章小结第29-31页
第三章 多GPU下神经网络的并行算法第31-41页
    3.1 多GPU并行特点第31页
    3.2 模型并行第31-34页
        3.2.1 划分隐藏层第32-33页
        3.2.2 划分隐藏层节点第33-34页
    3.3 数据并行第34-37页
        3.3.1 主从式结构第35-36页
        3.3.2 归约树结构第36-37页
    3.4 环形并行结构第37-39页
    3.5 本章小结第39-41页
第四章 算法实现第41-53页
    4.1 卷积运算的实现第41-43页
    4.2 单GPU下卷积神经网络的实现第43-48页
        4.2.1 卷积层的实现第44-45页
        4.2.2 下采样层的实现第45-47页
        4.2.3 全连接层的实现第47-48页
    4.3 模型参数初始化的实现第48-49页
    4.4 多GPU下环形并行结构的实现第49-51页
    4.5 本章小结第51-53页
第五章 实验与分析第53-61页
    5.1 实验平台与实验设计第53页
    5.2 MNIST数据集上的实验第53-57页
    5.3 CIFAR-10数据集上的实验第57-59页
    5.4 本章小结第59-61页
第六章 总结和展望第61-63页
    6.1 本文总结第61页
    6.2 本文的主要工作第61-62页
    6.3 下一步工作计划和展望第62-63页
参考文献第63-67页
致谢第67-69页
在读期间发表的学术论文与取得的研究成果第69页

论文共69页,点击 下载论文
上一篇:基于云平台商业模式的H公司管理信息系统分析与设计
下一篇:基于FPGA的直接数字频率合成器研究