首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

FPGA矩阵计算并行算法与结构

摘要第1-16页
Abstract第16-18页
第一章 绪论第18-36页
   ·研究背景第18-29页
     ·FPGA 可重构计算第18-26页
     ·矩阵计算第26-27页
     ·FPGA 设计面临的挑战第27-29页
     ·课题来源第29页
   ·研究现状第29-33页
     ·概况第29-30页
     ·浮点运算部件研究现状第30-31页
     ·FPGA 矩阵计算研究现状第31-33页
   ·论文主要工作和创新点第33-35页
   ·组织结构第35-36页
第二章 FPGA 基本矩阵运算第36-60页
   ·研究背景第36-40页
     ·矩阵和向量第36-37页
     ·基本矩阵运算第37-38页
     ·背景知识第38-40页
   ·相关工作第40-42页
     ·通用处理器的基本矩阵运算第40页
     ·基本矩阵运算的systolic 阵列第40-41页
     ·FPGA 基本矩阵运算第41-42页
   ·基本矩阵运算的FPGA 设计第42-51页
     ·结构模型第42-44页
     ·时空映射第44-47页
     ·模型构建第47-50页
     ·并行结构第50-51页
   ·FPGA 高性能分块矩阵乘第51-56页
     ·映射策略第51-52页
     ·矩阵乘分块第52-55页
     ·并行结构第55页
     ·性能分析第55-56页
   ·实验评测第56-59页
     ·基本框架评测第56-58页
     ·优化的矩阵乘并行结构评测第58-59页
   ·本章小结第59-60页
第三章 FPGA 稠密线性方程组求解第60-80页
   ·研究背景第60-63页
   ·相关工作第63-64页
     ·稠密线性方程组求解第63页
     ·FPGA 稠密线性方程组求解第63-64页
   ·稠密线性方程组求解流水线并行算法与结构第64-75页
     ·并行算法第64-69页
     ·并行结构第69-73页
     ·性能模型第73-75页
   ·实验评测第75-79页
     ·实现与测试建立第75-76页
     ·性能与性能比较第76-79页
   ·本章小结第79-80页
第四章 FPGA 分块稠密矩阵分解第80-112页
   ·研究背景第81-84页
     ·稠密矩阵LU 分解第81-82页
     ·稠密矩阵Cholesky 分解第82-84页
   ·相关工作第84-87页
     ·通用处理器稠密矩阵分解第84-85页
     ·Cell 和GPU 稠密矩阵分解第85-86页
     ·FPGA 稠密矩阵分解第86-87页
   ·FPGA 分块稠密矩阵分解第87-103页
     ·稠密矩阵LU 分解分块方法第87-93页
     ·分块稠密矩阵LU 分解并行结构第93-94页
     ·并行结构性能分析第94-96页
     ·并行结构多FPGA 扩展第96-98页
     ·Cholesky 分解的分块算法第98-103页
   ·实验评测第103-110页
     ·实现与测试建立第103-106页
     ·性能第106-108页
     ·性能和功耗比较第108-110页
   ·本章小结第110-112页
第五章 FPGA 稀疏线性方程组直接法求解第112-142页
   ·研究背景第113-118页
     ·稀疏矩阵第113-115页
     ·稀疏线性方程组直接法求解第115-116页
     ·稀疏矩阵LU 分解第116-118页
   ·相关工作第118-119页
     ·通用处理器稀疏矩阵LU 分解第118-119页
     ·FPGA 稀疏矩阵LU 分解第119页
   ·FPGA 稀疏矩阵Right-Looking LU 分解第119-127页
     ·Right-Looking LU 分解并行算法第120-124页
     ·Right-Looking LU 分解并行结构第124-127页
   ·FPGA 稀疏矩阵Left-Looking LU 分解第127-135页
     ·计算模型第127-128页
     ·Left-Looking LU 分解并行算法第128-132页
     ·Left-Looking LU 分解并行结构第132-135页
   ·实验评测第135-139页
     ·实现与测试建立第135-136页
     ·性能第136-138页
     ·性能比较第138-139页
   ·本章小结第139-142页
第六章 FPGA 稀疏线性方程组迭代法求解第142-172页
   ·研究背景第143-145页
     ·CG第143-144页
     ·SpMV第144-145页
   ·相关工作第145-148页
     ·通用处理器SpMV 优化技术第145-146页
     ·GPU 的SpMV第146页
     ·面向FEM 的SpMV 并行结构第146-147页
     ·FPGA SpMV 和迭代法第147-148页
   ·SpMV 并行结构第148-162页
     ·NBCSR:嵌套分块CSR第149-154页
     ·基本SpMV 并行结构第154-158页
     ·减少填零的SpMV 并行结构第158-162页
   ·CG 并行结构第162-164页
     ·总体结构第162-163页
     ·模块设计第163-164页
   ·实验评测第164-171页
     ·SpMV 并行结构评测第164-170页
     ·CG 并行结构评测第170-171页
   ·本章小结第171-172页
第七章 结论与展望第172-176页
   ·工作总结第172-173页
   ·研究展望第173-176页
致谢第176-178页
参考文献第178-198页
作者在学期间取得的学术成果第198-200页
作者在学期间参加的科研工作第200页

论文共200页,点击 下载论文
上一篇:面向特征的SystemC模型产品线的开发和形式化功能验证技术研究
下一篇:大规模Lustre集群文件系统关键技术的研究