首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于FPGA的BLAS加速系统的设计与研究

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-11页
   ·研究意义第8页
   ·研究现状与研究背景第8-9页
     ·BLAS数学库的应用第8页
     ·国内外BLAS数学库的研究现状第8-9页
   ·课题来源和研究方法第9页
   ·本文内容和章节安排第9-11页
第二章 BLAS和乘加器的研究第11-27页
   ·几种BLAS数学库的性能分析第11页
   ·BLAS数学库的核心分析第11-12页
   ·可加速部分的分析第12页
   ·乘法器和加法器的研究第12-27页
     ·乘法定义第13页
     ·乘法器的分类第13-16页
       ·迭代乘法器第13-14页
       ·线性阵列乘法器第14-15页
       ·并行乘法器第15-16页
     ·乘法器编码算法第16-17页
     ·乘法器拓扑结构第17-22页
     ·加法器第22-25页
       ·全加器第22-23页
       ·行波进位加法器第23页
       ·超前进位加法器第23-25页
       ·选择进位加法器第25页
       ·进位保留加法器第25页
     ·乘加器研究总结第25-27页
第三章 加速系统设计思想和方案第27-33页
   ·加速系统整体架构设计第27页
   ·加速系统结构设计第27-30页
     ·加速系统硬件结构第27-28页
     ·加速系统软件结构第28-30页
   ·加速系统设计分析第30-33页
     ·加速系统硬件分析第30-31页
     ·加速系统软件分析第31-33页
第四章 BLAS加速系统的实现第33-52页
   ·数学库的设计实现第33-39页
     ·数学库计算范围的确定第33-34页
     ·任务分配以及作业调度第34-39页
     ·负载均衡及其优化实现第39页
   ·加速卡硬件的设计实现第39-52页
     ·PCI-E控制模块的实现第40-43页
       ·矩阵数据写入QDR2控制模块第41-42页
       ·矩阵数据写入运算单元控制模块第42-43页
       ·运算单元将矩阵数据写入PCIE控制模块第43页
     ·SRAM读写控制器模块的实现第43-50页
       ·QDRⅡ控制模块的外部接口第44-46页
       ·QDRⅡ SRAM的总线第46页
       ·与QDRⅡ SRAM写操作相关物理接口第46-48页
       ·与QDRⅡ SRAM读操作相关物理接口第48-50页
     ·运算阵列模块的实现第50-52页
第五章 实验、分析及结论第52-55页
   ·测试方案设计第52页
   ·测试环境第52页
   ·测试结果和结果分析第52-55页
第六章 总结和展望第55-57页
   ·本文的工作第55页
   ·研究成果第55-56页
   ·研究展望第56-57页
参考文献第57-60页
致谢第60-61页
发表的学术论文和参与的科研活动第61-62页
附录1 DGEMM详细介绍第62-63页

论文共63页,点击 下载论文
上一篇:数字人格:数字虚拟世界的另一个“我”
下一篇:PBL在高职计算机专业课程中的理论探索与实践研究