基于异构计算平台的并行神经网络训练算法设计
摘要 | 第3-4页 |
abstract | 第4页 |
第1章 绪论 | 第7-13页 |
1.1 研究背景及研究意义 | 第7-8页 |
1.2 国内外研究现状 | 第8-9页 |
1.3 论文主要研究内容及创新点 | 第9-11页 |
1.4 论文结构安排 | 第11页 |
1.5 本章小结 | 第11-13页 |
第2章 异构计算平台架构与编程模型 | 第13-21页 |
2.1 异构计算平台 | 第13页 |
2.2 GPU简介 | 第13-14页 |
2.3 GPU体系架构 | 第14-15页 |
2.4 GPU与CPU的区别 | 第15-17页 |
2.5 OpenCL编程方法简介 | 第17-20页 |
2.5.1 GPU编程框架 | 第17页 |
2.5.2 OpenCL编程框架 | 第17-19页 |
2.5.3 OpenCL编程过程 | 第19-20页 |
2.6 本章小结 | 第20-21页 |
第3章 多层前馈全连接神经网络 | 第21-27页 |
3.1 全连接神经网络发展历程 | 第21页 |
3.2 全连接神经网络结构 | 第21-24页 |
3.3 神经网络训练优化技术 | 第24-25页 |
3.4 本章小结 | 第25-27页 |
第4章 BFGS拟牛顿算法并行实现 | 第27-43页 |
4.1 牛顿法 | 第27-29页 |
4.2 DFP拟牛顿算法 | 第29-30页 |
4.3 BFGS拟牛顿算法 | 第30-32页 |
4.4 BFGS拟牛顿算法并行实现方法 | 第32-37页 |
4.4.1 计算神经网络误差ET | 第35页 |
4.4.2 计算搜索方向dir | 第35-36页 |
4.4.3 黄金分割法计算步长λ并更新权重w | 第36页 |
4.4.4 计算梯度g | 第36-37页 |
4.4.5 计算尺度矩阵B | 第37页 |
4.4.6 并行归约求和 | 第37页 |
4.5 实验结果与分析 | 第37-41页 |
4.5.1 算法性能测试 | 第38-40页 |
4.5.2 微波器件建模实验 | 第40-41页 |
4.6 本章小结 | 第41-43页 |
第5章 主从型多群体PSO并行算法实现 | 第43-61页 |
5.1 PSO算法背景简介 | 第43-45页 |
5.2 并行PSO算法 | 第45-47页 |
5.3 多群体PSO算法 | 第47-49页 |
5.4 主从型多群体PSO算法并行实现方法 | 第49-55页 |
5.4.1 随机数产生 | 第50-51页 |
5.4.2 粒子速度与位置更新 | 第51-52页 |
5.4.3 适应度的计算 | 第52页 |
5.4.4 局部并行归约 | 第52-55页 |
5.4.5 全局并行归约 | 第55页 |
5.5 实验结果与分析 | 第55-59页 |
5.5.1 算法性能测试 | 第56-58页 |
5.5.2 与现有的PSO并行实现对比 | 第58页 |
5.5.3 实际应用 | 第58-59页 |
5.6 本章小结 | 第59-61页 |
第6章 BFGS-PSO并行混合算法实现 | 第61-67页 |
6.1 BFGS拟牛顿算法与PSO算法的互补性 | 第61页 |
6.2 BFGS-PSO并行混合算法结构 | 第61-63页 |
6.3 实验结果与分析 | 第63-64页 |
6.3.1 收敛速度测试 | 第63-64页 |
6.3.2 训练误差测试 | 第64页 |
6.4 本章小结 | 第64-67页 |
第7章 总结与展望 | 第67-69页 |
参考文献 | 第69-73页 |
发表论文和参加科研情况说明 | 第73-75页 |
致谢 | 第75页 |