基于异构计算平台的并行神经网络训练算法设计

摘要	第3-4页
abstract	第4页
第1章绪论	第7-13页
1.1 研究背景及研究意义	第7-8页
1.2 国内外研究现状	第8-9页
1.3 论文主要研究内容及创新点	第9-11页
1.4 论文结构安排	第11页
1.5 本章小结	第11-13页
第2章异构计算平台架构与编程模型	第13-21页
2.1 异构计算平台	第13页
2.2 GPU简介	第13-14页
2.3 GPU体系架构	第14-15页
2.4 GPU与CPU的区别	第15-17页
2.5 OpenCL编程方法简介	第17-20页
2.5.1 GPU编程框架	第17页
2.5.2 OpenCL编程框架	第17-19页
2.5.3 OpenCL编程过程	第19-20页
2.6 本章小结	第20-21页
第3章多层前馈全连接神经网络	第21-27页
3.1 全连接神经网络发展历程	第21页
3.2 全连接神经网络结构	第21-24页
3.3 神经网络训练优化技术	第24-25页
3.4 本章小结	第25-27页
第4章 BFGS拟牛顿算法并行实现	第27-43页
4.1 牛顿法	第27-29页
4.2 DFP拟牛顿算法	第29-30页
4.3 BFGS拟牛顿算法	第30-32页
4.4 BFGS拟牛顿算法并行实现方法	第32-37页
4.4.1 计算神经网络误差ET	第35页
4.4.2 计算搜索方向dir	第35-36页
4.4.3 黄金分割法计算步长λ并更新权重w	第36页
4.4.4 计算梯度g	第36-37页
4.4.5 计算尺度矩阵B	第37页
4.4.6 并行归约求和	第37页
4.5 实验结果与分析	第37-41页
4.5.1 算法性能测试	第38-40页
4.5.2 微波器件建模实验	第40-41页
4.6 本章小结	第41-43页
第5章主从型多群体PSO并行算法实现	第43-61页
5.1 PSO算法背景简介	第43-45页
5.2 并行PSO算法	第45-47页
5.3 多群体PSO算法	第47-49页
5.4 主从型多群体PSO算法并行实现方法	第49-55页
5.4.1 随机数产生	第50-51页
5.4.2 粒子速度与位置更新	第51-52页
5.4.3 适应度的计算	第52页
5.4.4 局部并行归约	第52-55页
5.4.5 全局并行归约	第55页
5.5 实验结果与分析	第55-59页
5.5.1 算法性能测试	第56-58页
5.5.2 与现有的PSO并行实现对比	第58页
5.5.3 实际应用	第58-59页
5.6 本章小结	第59-61页
第6章 BFGS-PSO并行混合算法实现	第61-67页
6.1 BFGS拟牛顿算法与PSO算法的互补性	第61页
6.2 BFGS-PSO并行混合算法结构	第61-63页
6.3 实验结果与分析	第63-64页
6.3.1 收敛速度测试	第63-64页
6.3.2 训练误差测试	第64页
6.4 本章小结	第64-67页
第7章总结与展望	第67-69页
参考文献	第69-73页
发表论文和参加科研情况说明	第73-75页
致谢	第75页