基于FPGA的卷积神经网络并行结构研究
| 摘要 | 第1-7页 |
| Abstract | 第7-12页 |
| 第1章 绪论 | 第12-31页 |
| ·研究背景及意义 | 第12-14页 |
| ·国内外研究现状 | 第14-27页 |
| ·卷积神经网络应用 | 第14-18页 |
| ·卷积神经网络软硬件实现 | 第18-19页 |
| ·二维卷积数据缓存技术 | 第19-24页 |
| ·FPGA 实现卷积神经网络关键技术 | 第24-27页 |
| ·论文的研究内容与课题来源 | 第27-28页 |
| ·论文的组织结构 | 第28-31页 |
| 第2章 CNN 计算架构及并行体系结构 | 第31-51页 |
| ·CNN 整体计算框架 | 第31-33页 |
| ·CNN 计算框架 | 第31-32页 |
| ·典型系统示例 | 第32-33页 |
| ·CNN 计算特征分析 | 第33-41页 |
| ·CNN 多层计算模型 | 第33-36页 |
| ·CNN 并行性分析 | 第36-41页 |
| ·CNN 并行体系结构模版 | 第41-50页 |
| ·层内计算的并行结构 | 第41-45页 |
| ·可配置并行结构模版 | 第45-48页 |
| ·应用示例 | 第48-50页 |
| ·本章小结 | 第50-51页 |
| 第3章 卷积神经网络计算划分 | 第51-67页 |
| ·参数化层内计算模型 | 第51-54页 |
| ·参数定义 | 第51-53页 |
| ·CNN 层内计算模型 | 第53-54页 |
| ·计算划分 | 第54-60页 |
| ·映射策略 | 第55-56页 |
| ·计算分块 | 第56-57页 |
| ·存储资源受限的循环划分 | 第57-58页 |
| ·计算资源受限的循环划分 | 第58-59页 |
| ·数据依赖性 | 第59-60页 |
| ·性能分析 | 第60-65页 |
| ·资源约束 | 第60-62页 |
| ·多输入单输出性能分析 | 第62-64页 |
| ·多输入多输出性能分析 | 第64-65页 |
| ·本章小结 | 第65-67页 |
| 第4章 二维卷积数据缓存技术 | 第67-82页 |
| ·引言 | 第67-74页 |
| ·二维卷积数据缓存实现策略 | 第67-69页 |
| ·二维卷积计算中的数据重用分析 | 第69-71页 |
| ·现有二维卷积缓存结构优缺点分析 | 第71-74页 |
| ·面积优化的缓存结构设计 | 第74-77页 |
| ·基于轮转方法的数据缓存结构 | 第74-75页 |
| ·性能分析 | 第75-77页 |
| ·带宽优化的缓存结构设计 | 第77-81页 |
| ·流水线数据缓存结构 | 第78-80页 |
| ·性能分析 | 第80-81页 |
| ·本章小结 | 第81-82页 |
| 第5章 卷积神经网络拓扑结构设计 | 第82-102页 |
| ·卷积神经网络拓扑结构 | 第82-87页 |
| ·CNN 拓扑结构分析 | 第82-84页 |
| ·卷积核的设计 | 第84-86页 |
| ·特征映射图数量 | 第86-87页 |
| ·卷积神经网络数值精度及格式 | 第87-91页 |
| ·C 模型操作数数值精度 | 第88-89页 |
| ·CNN 定点数表示 | 第89-91页 |
| ·实验与分析 | 第91-101页 |
| ·实验方案与设置 | 第91-94页 |
| ·性能与分析 | 第94-101页 |
| ·本章小结 | 第101-102页 |
| 结论 | 第102-104页 |
| 参考文献 | 第104-117页 |
| 攻读博士学位期间发表的论文 | 第117-118页 |
| 致谢 | 第118页 |