| 摘要 | 第1-4页 |
| Abstract | 第4-7页 |
| 1 绪论 | 第7-11页 |
| ·研究历史背景和意义 | 第7-8页 |
| ·国内外研究动态 | 第8-10页 |
| ·DBF处理系统的研究动态 | 第8页 |
| ·GPU的研究动态 | 第8-10页 |
| ·本文的主要内容和安排 | 第10-11页 |
| 2 图形处理器硬件架构及其软件开发环境 | 第11-25页 |
| ·图形处理器及其硬件架构 | 第11-12页 |
| ·CUDA架构及其编程模型 | 第12-19页 |
| ·CUDA架构简介 | 第12-13页 |
| ·CUDA内核简介 | 第13-14页 |
| ·线程层次 | 第14-15页 |
| ·存储器层次 | 第15-19页 |
| ·CUDA的软件开发环境 | 第19-22页 |
| ·CUDA C并行编程 | 第22-24页 |
| ·本章小结 | 第24-25页 |
| 3 基于GPU的正交化算法的设计与优化编程实现 | 第25-39页 |
| ·正交化算法原理 | 第25-26页 |
| ·针对CUDA平台对正交化算法的改造 | 第26-32页 |
| ·基于CUDA的向量相乘函数的优化编程实现 | 第26-28页 |
| ·基于CUDA的复数向量相乘函数的优化编程实现 | 第28-30页 |
| ·基于CUDA的正交化算法的优化编程实现 | 第30-32页 |
| ·算法仿真及运算速度测试对比 | 第32-38页 |
| ·测试平台 | 第32-34页 |
| ·CUDA计时函数 | 第34-35页 |
| ·基于GPU和CPU的实数向量相乘运算速度测试对比 | 第35-36页 |
| ·优化前后的虚数向量相乘函数速度测试对比 | 第36-37页 |
| ·基于DSP和GPU的正交化算法仿真及速度测试对比 | 第37-38页 |
| ·本章小结 | 第38-39页 |
| 4 基GPU的FRRMVB算法的设计与优化编程实现 | 第39-52页 |
| ·FRRMVB算法原理 | 第39-41页 |
| ·针对CUDA平台对FRRMVB算法的改造 | 第41-48页 |
| ·基于CUDA的矩阵相乘函数的优化编程实现 | 第41-44页 |
| ·基于CUDA的矩阵求逆函数的优化编程实现 | 第44-47页 |
| ·基于CUDA的FRRMVB算法的优化编程实现 | 第47-48页 |
| ·算法仿真及运算速度测试对比 | 第48-51页 |
| ·基于CUDA的矩阵相乘函数速度测试对比 | 第48-49页 |
| ·基于CUDA的矩阵求逆函数速度测试对比 | 第49-50页 |
| ·基于DSP和GPU的FRRMVB算法仿真及速度测试对比 | 第50-51页 |
| ·章节小结 | 第51-52页 |
| 5 基于多GPU+FPGA的DBF处理器方案设计 | 第52-62页 |
| ·基于多GPU+FPGA的DBF处理器 | 第52页 |
| ·基于多GPU+FPGA的DBF处理器实现框架 | 第52-60页 |
| ·FPGA板卡 | 第53-56页 |
| ·GPU模块 | 第56-58页 |
| ·PCI-E总线背板 | 第58-60页 |
| ·基于多GPU+FPGA的DBF处理器中数据流分析 | 第60-62页 |
| 6 总结与展望 | 第62-63页 |
| 致谢 | 第63-64页 |
| 参考文献 | 第64-66页 |