| 摘要 | 第1-16页 |
| Abstract | 第16-18页 |
| 第一章 绪论 | 第18-36页 |
| ·研究背景 | 第18-29页 |
| ·FPGA 可重构计算 | 第18-26页 |
| ·矩阵计算 | 第26-27页 |
| ·FPGA 设计面临的挑战 | 第27-29页 |
| ·课题来源 | 第29页 |
| ·研究现状 | 第29-33页 |
| ·概况 | 第29-30页 |
| ·浮点运算部件研究现状 | 第30-31页 |
| ·FPGA 矩阵计算研究现状 | 第31-33页 |
| ·论文主要工作和创新点 | 第33-35页 |
| ·组织结构 | 第35-36页 |
| 第二章 FPGA 基本矩阵运算 | 第36-60页 |
| ·研究背景 | 第36-40页 |
| ·矩阵和向量 | 第36-37页 |
| ·基本矩阵运算 | 第37-38页 |
| ·背景知识 | 第38-40页 |
| ·相关工作 | 第40-42页 |
| ·通用处理器的基本矩阵运算 | 第40页 |
| ·基本矩阵运算的systolic 阵列 | 第40-41页 |
| ·FPGA 基本矩阵运算 | 第41-42页 |
| ·基本矩阵运算的FPGA 设计 | 第42-51页 |
| ·结构模型 | 第42-44页 |
| ·时空映射 | 第44-47页 |
| ·模型构建 | 第47-50页 |
| ·并行结构 | 第50-51页 |
| ·FPGA 高性能分块矩阵乘 | 第51-56页 |
| ·映射策略 | 第51-52页 |
| ·矩阵乘分块 | 第52-55页 |
| ·并行结构 | 第55页 |
| ·性能分析 | 第55-56页 |
| ·实验评测 | 第56-59页 |
| ·基本框架评测 | 第56-58页 |
| ·优化的矩阵乘并行结构评测 | 第58-59页 |
| ·本章小结 | 第59-60页 |
| 第三章 FPGA 稠密线性方程组求解 | 第60-80页 |
| ·研究背景 | 第60-63页 |
| ·相关工作 | 第63-64页 |
| ·稠密线性方程组求解 | 第63页 |
| ·FPGA 稠密线性方程组求解 | 第63-64页 |
| ·稠密线性方程组求解流水线并行算法与结构 | 第64-75页 |
| ·并行算法 | 第64-69页 |
| ·并行结构 | 第69-73页 |
| ·性能模型 | 第73-75页 |
| ·实验评测 | 第75-79页 |
| ·实现与测试建立 | 第75-76页 |
| ·性能与性能比较 | 第76-79页 |
| ·本章小结 | 第79-80页 |
| 第四章 FPGA 分块稠密矩阵分解 | 第80-112页 |
| ·研究背景 | 第81-84页 |
| ·稠密矩阵LU 分解 | 第81-82页 |
| ·稠密矩阵Cholesky 分解 | 第82-84页 |
| ·相关工作 | 第84-87页 |
| ·通用处理器稠密矩阵分解 | 第84-85页 |
| ·Cell 和GPU 稠密矩阵分解 | 第85-86页 |
| ·FPGA 稠密矩阵分解 | 第86-87页 |
| ·FPGA 分块稠密矩阵分解 | 第87-103页 |
| ·稠密矩阵LU 分解分块方法 | 第87-93页 |
| ·分块稠密矩阵LU 分解并行结构 | 第93-94页 |
| ·并行结构性能分析 | 第94-96页 |
| ·并行结构多FPGA 扩展 | 第96-98页 |
| ·Cholesky 分解的分块算法 | 第98-103页 |
| ·实验评测 | 第103-110页 |
| ·实现与测试建立 | 第103-106页 |
| ·性能 | 第106-108页 |
| ·性能和功耗比较 | 第108-110页 |
| ·本章小结 | 第110-112页 |
| 第五章 FPGA 稀疏线性方程组直接法求解 | 第112-142页 |
| ·研究背景 | 第113-118页 |
| ·稀疏矩阵 | 第113-115页 |
| ·稀疏线性方程组直接法求解 | 第115-116页 |
| ·稀疏矩阵LU 分解 | 第116-118页 |
| ·相关工作 | 第118-119页 |
| ·通用处理器稀疏矩阵LU 分解 | 第118-119页 |
| ·FPGA 稀疏矩阵LU 分解 | 第119页 |
| ·FPGA 稀疏矩阵Right-Looking LU 分解 | 第119-127页 |
| ·Right-Looking LU 分解并行算法 | 第120-124页 |
| ·Right-Looking LU 分解并行结构 | 第124-127页 |
| ·FPGA 稀疏矩阵Left-Looking LU 分解 | 第127-135页 |
| ·计算模型 | 第127-128页 |
| ·Left-Looking LU 分解并行算法 | 第128-132页 |
| ·Left-Looking LU 分解并行结构 | 第132-135页 |
| ·实验评测 | 第135-139页 |
| ·实现与测试建立 | 第135-136页 |
| ·性能 | 第136-138页 |
| ·性能比较 | 第138-139页 |
| ·本章小结 | 第139-142页 |
| 第六章 FPGA 稀疏线性方程组迭代法求解 | 第142-172页 |
| ·研究背景 | 第143-145页 |
| ·CG | 第143-144页 |
| ·SpMV | 第144-145页 |
| ·相关工作 | 第145-148页 |
| ·通用处理器SpMV 优化技术 | 第145-146页 |
| ·GPU 的SpMV | 第146页 |
| ·面向FEM 的SpMV 并行结构 | 第146-147页 |
| ·FPGA SpMV 和迭代法 | 第147-148页 |
| ·SpMV 并行结构 | 第148-162页 |
| ·NBCSR:嵌套分块CSR | 第149-154页 |
| ·基本SpMV 并行结构 | 第154-158页 |
| ·减少填零的SpMV 并行结构 | 第158-162页 |
| ·CG 并行结构 | 第162-164页 |
| ·总体结构 | 第162-163页 |
| ·模块设计 | 第163-164页 |
| ·实验评测 | 第164-171页 |
| ·SpMV 并行结构评测 | 第164-170页 |
| ·CG 并行结构评测 | 第170-171页 |
| ·本章小结 | 第171-172页 |
| 第七章 结论与展望 | 第172-176页 |
| ·工作总结 | 第172-173页 |
| ·研究展望 | 第173-176页 |
| 致谢 | 第176-178页 |
| 参考文献 | 第178-198页 |
| 作者在学期间取得的学术成果 | 第198-200页 |
| 作者在学期间参加的科研工作 | 第200页 |