摘要 | 第10-11页 |
ABSTRACT | 第11页 |
第一章 前言 | 第13-23页 |
1.1 课题研究背景 | 第13-14页 |
1.2 课题研究现状 | 第14-20页 |
1.2.1 定点化运算研究现状 | 第14-16页 |
1.2.2 高级综合设计技术研究现状 | 第16-17页 |
1.2.3 AXI4协议现状 | 第17-20页 |
1.3 课题研究内容 | 第20-21页 |
1.3.1 CNN算法的定点化分析 | 第20-21页 |
1.3.2 基于HLS的优化设计技术 | 第21页 |
1.3.3 基于AXI的优化设计技术 | 第21页 |
1.4 论文组织结构 | 第21-23页 |
第二章 CNN算法定点化方法 | 第23-28页 |
2.1 定点化技术 | 第23-24页 |
2.2 CNN定点化模型及仿真技术 | 第24页 |
2.3 软件仿真平台及仿真结果 | 第24-28页 |
第三章 基于HLS的优化设计技术 | 第28-45页 |
3.1 HLS设计方法 | 第28-30页 |
3.2 基于HLS的LeNet算法结构 | 第30-40页 |
3.2.1 LeNet算法 | 第30-31页 |
3.2.2 加速器体系结构设计 | 第31-35页 |
3.2.3 卷积算法核设计 | 第35-40页 |
3.3 加速器实现 | 第40-45页 |
3.3.1 LeNet加速器的实现结果及分析 | 第40-42页 |
3.3.2 卷积算法核的实现对比 | 第42-45页 |
第四章 基于AXI的优化设计技术 | 第45-69页 |
4.1 面向DCNN的全流水加速结构 | 第45-47页 |
4.1.1 CNN加速方法分析 | 第45-46页 |
4.1.2 全流水加速器设计 | 第46-47页 |
4.2 FPGA总线框架顶层设计 | 第47-48页 |
4.3 AXI设计方法 | 第48-63页 |
4.3.1 CreateBlockDesign设计流 | 第49-50页 |
4.3.2 CreateAXI4Peripheral设计流 | 第50-55页 |
4.3.3 AXI4/AXIS设计流程 | 第55页 |
4.3.4 定制AXI4Peripheral | 第55-63页 |
4.4 基于AXI4的AlexNet体系结构及其实现 | 第63-69页 |
4.4.1 AlexNet体系结构分析 | 第63-64页 |
4.4.2 非框架结构的加速器实现结果 | 第64页 |
4.4.3 框架结构的加速器实现结果 | 第64-69页 |
第五章 总结与展望 | 第69-70页 |
5.1 工作总结 | 第69页 |
5.2 研究展望 | 第69-70页 |
致谢 | 第70-71页 |
参考文献 | 第71-76页 |
作者在学期间取得的学术成果 | 第76页 |