摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-12页 |
1.1 课题研究背景 | 第8-9页 |
1.2 国内外研究现状 | 第9-11页 |
1.3 本文研究内容及结构安排 | 第11-12页 |
2 HEVC关键模块视频编码技术原理与CUDA概述 | 第12-31页 |
2.1 HEVC编码器框架及关键技术 | 第12-28页 |
2.1.1 HEVC编码器框架和特色编码单元 | 第12-15页 |
2.1.2 HEVC帧间预测关键技术 | 第15-21页 |
2.1.3 HEVC变换和量化关键技术 | 第21-23页 |
2.1.4 HEVC环路滤波关键技术 | 第23-28页 |
2.2 GPU与CUDA架构概述 | 第28-31页 |
2.2.1 GPU硬件架构 | 第28页 |
2.2.2 CUDA编程模型 | 第28-29页 |
2.2.3 CUDA存储器 | 第29-31页 |
3 基于CUDA的HEVC关键模块并行算法的设计与实现 | 第31-57页 |
3.1 分像素插值并行算法的设计与实现 | 第31-36页 |
3.1.1 亮度1/4分像素插值并行算法的设计 | 第31-33页 |
3.1.2 色度1/8分像素插值并行算法的设计 | 第33-34页 |
3.1.3 分像素插值并行算法理论并行度分析 | 第34-36页 |
3.2 运动估计并行算法的设计与实现 | 第36-42页 |
3.2.1 运动估计数据相关性的分析 | 第36页 |
3.2.2 整像素运动搜索并行算法的设计 | 第36-39页 |
3.2.3 分像素运动搜索并行算法的设计 | 第39-40页 |
3.2.4 运动估计并行算法理论并行度分析 | 第40-42页 |
3.3 变换和量化并行算法的设计与实现 | 第42-46页 |
3.3.1 整数DCT和量化并行算法的设计 | 第42-44页 |
3.3.2 反量化和整数IDCT并行算法的设计 | 第44页 |
3.3.3 变换量化并行算法理论并行度分析 | 第44-46页 |
3.4 去方块效应滤波并行算法的设计与实现 | 第46-48页 |
3.4.1 去方块效应滤波并行算法的设计 | 第46-47页 |
3.4.2 去方块效应滤波并行算法理论并行度的分析 | 第47-48页 |
3.5 样点自适应补偿并行算法的设计与实现 | 第48-57页 |
3.5.1 像素分类和信息统计并行算法的设计 | 第48-50页 |
3.5.2 补偿值及失真计算并行算法的设计 | 第50-52页 |
3.5.3 融合技术并行算法的设计 | 第52-54页 |
3.5.4 样点自适应补偿滤波并行算法的设计 | 第54页 |
3.5.5 样点自适应补偿并行算法理论并行度分析 | 第54-57页 |
4 实验结果举例与分析 | 第57-65页 |
4.1 分像素插值并行算法实验结果与分析 | 第58-59页 |
4.2 运动估计并行算法实验结果与分析 | 第59-60页 |
4.3 变换量化并行算法实验结果与分析 | 第60-61页 |
4.4 环路滤波并行算法实验结果与分析 | 第61-63页 |
4.5 帧间回路整体并行算法实验结果与分析 | 第63-65页 |
5 总结与展望 | 第65-66页 |
参考文献 | 第66-69页 |
攻读硕士学位期间发表学术论文情况 | 第69-70页 |
致谢 | 第70-71页 |