摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第1章 绪论 | 第10-14页 |
1.1 引言 | 第10页 |
1.2 课题背景和意义 | 第10-11页 |
1.3 国内外研究现状 | 第11-12页 |
1.4 研究目标及贡献 | 第12-13页 |
1.5 本文组织结构 | 第13-14页 |
第2章 浮点运算单元的硬件架构 | 第14-26页 |
2.1 引言 | 第14页 |
2.2 布思定点乘法单元的设计 | 第14-18页 |
2.2.1 基2布思编码算法 | 第14-16页 |
2.2.2 基4布思编码算法 | 第16-17页 |
2.2.3 基4布思编码的阵列实现 | 第17-18页 |
2.3 单精度浮点加减法运算单元的设计及验证 | 第18-21页 |
2.3.1 浮点加减法与定点加减法 | 第18页 |
2.3.2 浮点加减法运算方式 | 第18-19页 |
2.3.3 浮点加减法运算单元的设计 | 第19-20页 |
2.3.4 实数浮点加减法单元的ModelSim仿真 | 第20-21页 |
2.4 单精度浮点乘法运算单元的设计及验证 | 第21-24页 |
2.4.1 浮点乘法与定点乘法 | 第21页 |
2.4.2 浮点乘法运算方式 | 第21-22页 |
2.4.3 浮点乘法运算单元的设计 | 第22-23页 |
2.4.4 实数浮点乘法单元的ModelSim仿真 | 第23-24页 |
2.5 单精度浮点乘法运算单元性能分析 | 第24-25页 |
2.6 小结 | 第25-26页 |
第3章 浮点及定点运算单元在卷积神经网络中的应用 | 第26-42页 |
3.1 引言 | 第26-27页 |
3.2 手写数字识别网络的高层次综合设计 | 第27-38页 |
3.2.1 手写数字识别网络 | 第27-31页 |
3.2.2 浮点激活函数的近似 | 第31-32页 |
3.2.3 高层次综合优化 | 第32-33页 |
3.2.4 流水线及循环展开 | 第33-35页 |
3.2.5 存储器访问优化 | 第35-36页 |
3.2.6 定点量化 | 第36-37页 |
3.2.7 嵌套循环重构 | 第37-38页 |
3.3 浮点和定点手写数字识别网络的FPGA验证及性能分析 | 第38-40页 |
3.3.1 浮点和定点手写数字识别网络的FPGA验证 | 第38-39页 |
3.3.2 浮点和定点手写数字识别网络的性能分析 | 第39-40页 |
3.4 小结 | 第40-42页 |
第4章 二的正整数次幂点离散傅里叶变换单元的硬件架构 | 第42-60页 |
4.1 引言 | 第42页 |
4.2 快速傅里叶变换 | 第42-47页 |
4.2.1 蝶形运算单元 | 第43-44页 |
4.2.2 旋转因子的处理 | 第44-45页 |
4.2.3 分裂基算法 | 第45-47页 |
4.3 基于分裂基的离散傅里叶变换单元设计 | 第47-49页 |
4.3.1 复数运算单元的设计 | 第47-48页 |
4.3.2 蝶形运算单元的设计 | 第48-49页 |
4.3.3 分裂基算法单元的设计 | 第49页 |
4.4 多点分裂基离散傅里叶变换单元自动生成 | 第49-56页 |
4.4.1 何为设计自动化,为什么要设计自动生成 | 第49-50页 |
4.4.2 分裂基算法的流水线 | 第50-55页 |
4.4.3 分裂基算法的自动生成 | 第55-56页 |
4.5 二的正整数次幂点离散傅里叶变换单元验证 | 第56-57页 |
4.5.1 16点离散傅里叶变换单元的ModelSim仿真 | 第56-57页 |
4.5.2 16点离散傅里叶变换单元的FPGA验证 | 第57页 |
4.6 小结 | 第57-60页 |
第5章 基于矩阵分解的两两互质数乘积点离散傅里叶变换快速算法 | 第60-72页 |
5.1 引言 | 第60页 |
5.2 小奇数点数离散傅里叶变换快速算法 | 第60-67页 |
5.2.1 基于矩阵分解的离散傅里叶变换快速算法 | 第61-62页 |
5.2.2 3点离散傅里叶变换稀疏矩阵 | 第62-63页 |
5.2.3 5点离散傅里叶变换稀疏矩阵 | 第63-64页 |
5.2.4 9点离散傅里叶变换稀疏矩阵 | 第64-66页 |
5.2.5 小奇数点数离散傅里叶变换快速算法性能分析 | 第66-67页 |
5.3 多个互质数乘积点离散傅里叶变换快速算法的推广和证明 | 第67-70页 |
5.4 小结 | 第70-72页 |
第6章 非二的正整数次幂点离散傅里叶变换单元的硬件架构 | 第72-86页 |
6.1 引言 | 第72页 |
6.2 AutoNFT的架构 | 第72-74页 |
6.3 非二的正整数次幂点离散傅里叶变换单元结构 | 第74-78页 |
6.3.1 输入顺序 | 第75-76页 |
6.3.2 输出顺序 | 第76-78页 |
6.4 自动生成算法 | 第78-79页 |
6.4.1 15点离散傅里叶变换单元自动生成 | 第79页 |
6.5 AutoNFT自动生成离散傅里叶变换单元性能分析 | 第79-84页 |
6.5.1 AutoNFT生成单元性能对照 | 第80-81页 |
6.5.2 256点定点离散傅里叶变换性能对照 | 第81-82页 |
6.5.3 8192点定点离散傅里叶变换性能对照 | 第82-83页 |
6.5.4 AutoNFT特性对照 | 第83-84页 |
6.6 小结 | 第84-86页 |
第7章 论文总结与展望 | 第86-88页 |
7.1 论文总结 | 第86-87页 |
7.2 未来展望 | 第87-88页 |
参考文献 | 第88-92页 |
致谢 | 第92-94页 |
在读期间发表的学术论文与取得的其他研究成果 | 第94页 |