首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

基于异构计算平台的并行神经网络训练算法设计

摘要第3-4页
abstract第4页
第1章 绪论第7-13页
    1.1 研究背景及研究意义第7-8页
    1.2 国内外研究现状第8-9页
    1.3 论文主要研究内容及创新点第9-11页
    1.4 论文结构安排第11页
    1.5 本章小结第11-13页
第2章 异构计算平台架构与编程模型第13-21页
    2.1 异构计算平台第13页
    2.2 GPU简介第13-14页
    2.3 GPU体系架构第14-15页
    2.4 GPU与CPU的区别第15-17页
    2.5 OpenCL编程方法简介第17-20页
        2.5.1 GPU编程框架第17页
        2.5.2 OpenCL编程框架第17-19页
        2.5.3 OpenCL编程过程第19-20页
    2.6 本章小结第20-21页
第3章 多层前馈全连接神经网络第21-27页
    3.1 全连接神经网络发展历程第21页
    3.2 全连接神经网络结构第21-24页
    3.3 神经网络训练优化技术第24-25页
    3.4 本章小结第25-27页
第4章 BFGS拟牛顿算法并行实现第27-43页
    4.1 牛顿法第27-29页
    4.2 DFP拟牛顿算法第29-30页
    4.3 BFGS拟牛顿算法第30-32页
    4.4 BFGS拟牛顿算法并行实现方法第32-37页
        4.4.1 计算神经网络误差ET第35页
        4.4.2 计算搜索方向dir第35-36页
        4.4.3 黄金分割法计算步长λ并更新权重w第36页
        4.4.4 计算梯度g第36-37页
        4.4.5 计算尺度矩阵B第37页
        4.4.6 并行归约求和第37页
    4.5 实验结果与分析第37-41页
        4.5.1 算法性能测试第38-40页
        4.5.2 微波器件建模实验第40-41页
    4.6 本章小结第41-43页
第5章 主从型多群体PSO并行算法实现第43-61页
    5.1 PSO算法背景简介第43-45页
    5.2 并行PSO算法第45-47页
    5.3 多群体PSO算法第47-49页
    5.4 主从型多群体PSO算法并行实现方法第49-55页
        5.4.1 随机数产生第50-51页
        5.4.2 粒子速度与位置更新第51-52页
        5.4.3 适应度的计算第52页
        5.4.4 局部并行归约第52-55页
        5.4.5 全局并行归约第55页
    5.5 实验结果与分析第55-59页
        5.5.1 算法性能测试第56-58页
        5.5.2 与现有的PSO并行实现对比第58页
        5.5.3 实际应用第58-59页
    5.6 本章小结第59-61页
第6章 BFGS-PSO并行混合算法实现第61-67页
    6.1 BFGS拟牛顿算法与PSO算法的互补性第61页
    6.2 BFGS-PSO并行混合算法结构第61-63页
    6.3 实验结果与分析第63-64页
        6.3.1 收敛速度测试第63-64页
        6.3.2 训练误差测试第64页
    6.4 本章小结第64-67页
第7章 总结与展望第67-69页
参考文献第69-73页
发表论文和参加科研情况说明第73-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:中国战略性新兴产业财务风险评估与预警--基于1018家上市公司财务数据的实证研究
下一篇:异三聚体G蛋白不同亚基在不同辐照度UV-B辐射诱导拟南芥叶片基因表达中的作用研究