摘要 | 第3-4页 |
ABSTRACT | 第4页 |
第1章 绪论 | 第7-12页 |
1.1 研究背景及意义 | 第7-8页 |
1.2 图像处理领域的算法 | 第8-9页 |
1.3 国内外研究现状 | 第9-10页 |
1.4 论文研究内容 | 第10页 |
1.5 论文的结构安排 | 第10-12页 |
第2章 GPU 通用计算 | 第12-24页 |
2.1 CPU 与 GPU 的异同 | 第12-14页 |
2.2 GPU 的硬件发展历史 | 第14-16页 |
2.3 CUDA 概述 | 第16-23页 |
2.3.1 CUDA 软件体系 | 第17-18页 |
2.3.2 CUDA 的存储器模型 | 第18-19页 |
2.3.3 CUDA 编程模型 | 第19-20页 |
2.3.4 CUDA 线程结构 | 第20-22页 |
2.3.5 CUDA 的编译流程 | 第22-23页 |
2.4 CUDA 平台的搭建 | 第23页 |
2.5 本章小结 | 第23-24页 |
第3章 GPU 并行典型图像处理算法 | 第24-44页 |
3.1 GPU 并行图像插值算法 | 第24-33页 |
3.1.1 最近邻插值 | 第24-25页 |
3.1.2 双线性插值在 GPU 上的实现 | 第25-27页 |
3.1.3 实验环境 | 第27-28页 |
3.1.4 实验结果与分析 | 第28-29页 |
3.1.5 立方卷积插值在 GPU 上的实现 | 第29-33页 |
3.3 GPU 并行掩模式平滑算法 | 第33-38页 |
3.3.1 选择式掩模平滑算法 | 第33-35页 |
3.3.2 选择式掩模平滑算法在 GPU 上的实现 | 第35-38页 |
3.4 GPU 并行 Robert 边缘检测算法 | 第38-43页 |
3.4.1 边缘检测原理 | 第38-40页 |
3.4.2 Roberts 算法在 GPU 上的实现 | 第40-43页 |
3.5 本章小结 | 第43-44页 |
第4章 CUDA 程序的优化 | 第44-54页 |
4.1 CUDA 程序的优化 | 第44-48页 |
4.1.1 block 和 thread 的分配 | 第44-45页 |
4.1.2 存储器访问优化 | 第45-46页 |
4.1.3 采用流和多 GPU 编程 | 第46-47页 |
4.1.4 指令流的优化 | 第47-48页 |
4.2 NVIDIA 性能检测工具 visual profiler | 第48-49页 |
4.3 双线性插值算法的优化 | 第49-53页 |
4.3.1 纹理存储器的优化插值算法 | 第49-51页 |
4.3.2 采用异步执行优化双线性插值算法 | 第51-53页 |
4.4 本章小结 | 第53-54页 |
第5章 结论与展望 | 第54-56页 |
5.1 结论 | 第54页 |
5.2 进一步工作方向 | 第54-56页 |
致谢 | 第56-57页 |
参考文献 | 第57-58页 |