GPU上基本图像处理算法性能优化关键技术研究

摘要	第5-7页
Abstract	第7-8页
第一章绪论	第11-19页
1.1 研究背景与意义	第11-13页
1.2 国内外研究现状	第13-15页
1.3 本文主要研究内容	第15-17页
1.4 本文的组织结构	第17-19页
第二章 GPU硬件架构及编程模型	第19-33页
2.1 GPU与CPU架构的区别	第19-20页
2.2 GPU硬件架构	第20-27页
2.2.1 AMD GPU架构	第20-24页
2.2.2 NVIDIA GPU架构	第24-27页
2.3 众核编程模型	第27-31页
2.3.1 OpenCL编程模型	第27-30页
2.3.2 CUDA编程模型	第30-31页
2.4 小结	第31-33页
第三章基本图像处理算法的并行性分析及优化原理	第33-41页
3.1 采样算法并行性分析	第33-34页
3.1.1 下采样算法	第33页
3.1.2 上采样算法	第33-34页
3.2 卷积算法并行性分析	第34页
3.3 过冲控制并行性分析	第34页
3.4 图像边界部分处理并行性分析	第34-35页
3.5 归约并行性分析	第35页
3.6 滤波并行性分析	第35-36页
3.6.1 水平滤波	第35页
3.6.2 垂直滤波	第35-36页
3.7 图像处理算法基本优化方法及其原理	第36-40页
3.7.1 数据传输优化	第36页
3.7.2 存储优化	第36-39页
3.7.3 NDRange优化	第39页
3.7.4 指令流优化	第39-40页
3.7.5 数据共享	第40页
3.7.6 数据相关	第40页
3.8 小结	第40-41页
第四章 Sharpness算法的分析及优化	第41-57页
4.1 Sharpness算法介绍	第41-46页
4.1.1 下采样	第41-42页
4.1.2 上采样	第42-43页
4.1.3 差值计算	第43-44页
4.1.4 图像锐化	第44-46页
4.2 Sharpness算法的GPU优化	第46-49页
4.2.1 Host和Device端的数据传输优化	第46页
4.2.2 Kernel融合	第46-47页
4.2.3 归约优化	第47-48页
4.2.4 向量化及数据本地化优化	第48页
4.2.5 边界优化	第48-49页
4.2.6 其他基本优化	第49页
4.3 Sharpness算法的SIMD优化	第49-50页
4.4 性能剖析	第50-57页
4.4.1 GPU和CPU性能对比	第51-54页
4.4.2 各优化方法带来的性能提升	第54-57页
第五章 Laplacian算法的分析及优化	第57-67页
5.1 Laplacian算法介绍	第57-60页
5.2 Laplacian算法的GPU优化	第60-63页
5.2.1 边界padding和水平滤波优化	第60-61页
5.2.2 垂直滤波和下采样优化	第61-62页
5.2.3 上采样算法优化	第62-63页
5.3 Laplacian算法的SIMD优化	第63页
5.4 性能剖析	第63-67页
第六章结论与展望	第67-71页
6.1 本文工作总结	第67-68页
6.2 研究展望	第68-71页
参考文献	第71-75页
致谢	第75-77页
个人简历、在学期间发表的论文与研究成果	第77页