摘要 | 第1-4页 |
Abstract | 第4-7页 |
1 绪论 | 第7-11页 |
·研究历史背景和意义 | 第7-8页 |
·国内外研究动态 | 第8-10页 |
·DBF处理系统的研究动态 | 第8页 |
·GPU的研究动态 | 第8-10页 |
·本文的主要内容和安排 | 第10-11页 |
2 图形处理器硬件架构及其软件开发环境 | 第11-25页 |
·图形处理器及其硬件架构 | 第11-12页 |
·CUDA架构及其编程模型 | 第12-19页 |
·CUDA架构简介 | 第12-13页 |
·CUDA内核简介 | 第13-14页 |
·线程层次 | 第14-15页 |
·存储器层次 | 第15-19页 |
·CUDA的软件开发环境 | 第19-22页 |
·CUDA C并行编程 | 第22-24页 |
·本章小结 | 第24-25页 |
3 基于GPU的正交化算法的设计与优化编程实现 | 第25-39页 |
·正交化算法原理 | 第25-26页 |
·针对CUDA平台对正交化算法的改造 | 第26-32页 |
·基于CUDA的向量相乘函数的优化编程实现 | 第26-28页 |
·基于CUDA的复数向量相乘函数的优化编程实现 | 第28-30页 |
·基于CUDA的正交化算法的优化编程实现 | 第30-32页 |
·算法仿真及运算速度测试对比 | 第32-38页 |
·测试平台 | 第32-34页 |
·CUDA计时函数 | 第34-35页 |
·基于GPU和CPU的实数向量相乘运算速度测试对比 | 第35-36页 |
·优化前后的虚数向量相乘函数速度测试对比 | 第36-37页 |
·基于DSP和GPU的正交化算法仿真及速度测试对比 | 第37-38页 |
·本章小结 | 第38-39页 |
4 基GPU的FRRMVB算法的设计与优化编程实现 | 第39-52页 |
·FRRMVB算法原理 | 第39-41页 |
·针对CUDA平台对FRRMVB算法的改造 | 第41-48页 |
·基于CUDA的矩阵相乘函数的优化编程实现 | 第41-44页 |
·基于CUDA的矩阵求逆函数的优化编程实现 | 第44-47页 |
·基于CUDA的FRRMVB算法的优化编程实现 | 第47-48页 |
·算法仿真及运算速度测试对比 | 第48-51页 |
·基于CUDA的矩阵相乘函数速度测试对比 | 第48-49页 |
·基于CUDA的矩阵求逆函数速度测试对比 | 第49-50页 |
·基于DSP和GPU的FRRMVB算法仿真及速度测试对比 | 第50-51页 |
·章节小结 | 第51-52页 |
5 基于多GPU+FPGA的DBF处理器方案设计 | 第52-62页 |
·基于多GPU+FPGA的DBF处理器 | 第52页 |
·基于多GPU+FPGA的DBF处理器实现框架 | 第52-60页 |
·FPGA板卡 | 第53-56页 |
·GPU模块 | 第56-58页 |
·PCI-E总线背板 | 第58-60页 |
·基于多GPU+FPGA的DBF处理器中数据流分析 | 第60-62页 |
6 总结与展望 | 第62-63页 |
致谢 | 第63-64页 |
参考文献 | 第64-66页 |