首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

申威平台上卷积神经网络库的实现与优化

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第16-22页
    1.1 研究背景第16-20页
        1.1.1 卷积神经网络发展趋势第16-17页
        1.1.2 CNN训练平台的发展趋势第17-19页
        1.1.3 神威太湖之光超算平台第19页
        1.1.4 本文的研究动机第19-20页
    1.2 论文研究目标和主要工作第20-21页
        1.2.1 swABL-DNN在申威平台上的实现第20页
        1.2.2 swABL-DNN测试框架实现第20-21页
        1.2.3 卷积库函数优化第21页
    1.3 论文结构第21-22页
第2章 相关工作第22-28页
    2.1 高性能计算平台中的深度学习库第22-25页
        2.1.1 Intel CPU第22-23页
        2.1.2 NVIDIA GPU第23-24页
        2.1.3 FPGA第24页
        2.1.4 神威太湖之光第24-25页
    2.2 卷积算法第25页
    2.3 神威太湖之光移植与优化第25-26页
        2.3.1 深度学习研究第25-26页
        2.3.2 其他相关研究第26页
    2.4 本章小结第26-28页
第3章 swABL-DNN库函数的设计与功能介绍第28-48页
    3.1 swABL-DNN设计目标第28-34页
        3.1.1 卷积神经网络分析第28-29页
        3.1.2 反向传播算法第29-31页
        3.1.3 库的数据结构和函数命名规则第31-33页
        3.1.4 库函数第33-34页
    3.2 库函数功能与计算分析第34-46页
        3.2.1 卷积层第34-39页
        3.2.2 池化层第39-41页
        3.2.3 归一化层库函数第41-42页
        3.2.4 激活层库函数第42-43页
        3.2.5 全连接层库函数第43-45页
        3.2.6 上采样层库函数第45页
        3.2.7 融合层库函数第45-46页
        3.2.8 总结第46页
    3.3 swABL-DNN正确性测试第46页
    3.4 本章小结第46-48页
第4章 swABL-DNN测试分析第48-56页
    4.1 测试程序第48页
    4.2 实现细节第48-51页
        4.2.1 网络层类第48-49页
        4.2.2 模型类第49-51页
    4.3 功能性测试与模型分析第51-53页
        4.3.1 U-Net第51-52页
        4.3.2 AlexNet第52-53页
    4.4 swABL-DNN正确性测试第53-54页
    4.5 本章小结第54-56页
第5章 卷积层库函数优化第56-74页
    5.1 申威处理器第56-58页
        5.1.1 从核访存优化第57-58页
        5.1.2 核心计算优化第58页
    5.2 卷积原语第58-60页
    5.3 矩阵乘法计算卷积第60-61页
    5.4 参数受限的并行卷积算法第61-63页
        5.4.1 申威从核阵列实现矩阵乘法第61-62页
        5.4.2 卷积参数受限分析第62-63页
    5.5 无参数限制的并行卷积算法第63-68页
        5.5.1 任务划分第63-64页
        5.5.2 数据重用第64-66页
        5.5.3 软件流水第66-67页
        5.5.4 手动向量化第67-68页
    5.6 算法对比测试第68-73页
        5.6.1 申威处理器并行卷积算法对比第68-71页
        5.6.2 商用平台卷积层API对比第71-73页
    5.7 本章小结第73-74页
第6章 全文总结第74-78页
    6.1 研究工作总结第74-75页
        6.1.1 swABL-DNN的设计与功能介绍第74页
        6.1.2 测试程序与模型分析第74-75页
        6.1.3 卷积层库函数优化第75页
    6.2 本文创新点第75页
    6.3 未来工作展望第75-78页
参考文献第78-82页
致谢第82-84页
在读期间发表的学术论文与取得的研究成果第84-86页
在读期间参与的科研项目第86页

论文共86页,点击 下载论文
上一篇:基于位置/力同步的电液位置伺服系统加载力控制研究
下一篇:基于深度强化学习的视频游戏模拟算法研究