摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 引言 | 第11-16页 |
1.1 课题来源及研究意义 | 第11页 |
1.2 国内外研究历史与现状 | 第11-14页 |
1.2.1 H.264编解码研究现状 | 第11-13页 |
1.2.2 GPU+H.264编解码的研究现状 | 第13-14页 |
1.3 研究内容与结构安排 | 第14-16页 |
1.3.1 本文主要研究内容 | 第14-15页 |
1.3.2 论文的结构安排 | 第15-16页 |
第二章 H.264标准与CUDA编程概述 | 第16-27页 |
2.1 H.264串并行解码架构 | 第16-21页 |
2.1.1 串行H.264解码架构 | 第16-17页 |
2.1.2 CPU-GPU异构编程架构 | 第17-21页 |
2.2 CUDA编程概述 | 第21-26页 |
2.2.1 CUDA硬件架构 | 第21-23页 |
2.2.2 CUDA软件体系 | 第23页 |
2.2.3 CUDA存储模型 | 第23-24页 |
2.2.4 CUDA存储优化 | 第24-26页 |
2.3 本章小结 | 第26-27页 |
第三章 基于GPU的反变换与反量化并行化的设计与优化 | 第27-39页 |
3.1 反变换与反量化原理 | 第27-29页 |
3.1.1 反量化 | 第27-28页 |
3.1.2 整数DCT反变换 | 第28-29页 |
3.1.3 变换系数逆扫描过程 | 第29页 |
3.2 反变换与反量化的并行性分析 | 第29-30页 |
3.2.1 反量化并行粒度分析 | 第29-30页 |
3.2.2 反变换并行粒度分析 | 第30页 |
3.3 反量化并行算法设计 | 第30-31页 |
3.4 反变换并行算法设计与优化 | 第31-36页 |
3.4.1 传统的反变换串行算法 | 第31页 |
3.4.2 蝶形反变换的并行化设计与优化 | 第31-34页 |
3.4.3 基于原理的反变换算法设计与优化 | 第34-36页 |
3.5 反变换与反量化结果分析 | 第36-38页 |
3.5.1 反量化串并行对比 | 第36-37页 |
3.5.2 反变换串并行对比 | 第37-38页 |
3.6 本章小结 | 第38-39页 |
第四章 基于GPU的帧内预测与帧间预测并行化的设计与优化 | 第39-53页 |
4.1 帧内预测原理 | 第39-42页 |
4.1.1 亮度帧内预测解码 | 第39-41页 |
4.1.2 色度帧内预测解码 | 第41-42页 |
4.2 帧内预测并行性分析 | 第42-43页 |
4.3 亮度4×4并行帧内预测的设计与优化 | 第43-47页 |
4.4 色度8×8宏块并行帧内预测的设计 | 第47-48页 |
4.5 帧间预测原理 | 第48-49页 |
4.6 帧间预测并行性分析与设计 | 第49-50页 |
4.7 帧内预测与帧间预测结果分析 | 第50-52页 |
4.7.1 亮度帧内预测串并行对比 | 第50-51页 |
4.7.2 色度帧内预测串并行对比 | 第51页 |
4.7.3 亮度帧间预测串并行对比 | 第51-52页 |
4.7.4 色度帧间预测串并行对比 | 第52页 |
4.8 本章小结 | 第52-53页 |
第五章 基于GPU的环路滤波并行化的设计与优化 | 第53-65页 |
5.1 环路滤波原理 | 第53-55页 |
5.2 环路滤波并行性分析 | 第55-56页 |
5.3 环路滤波并行算法设计与优化 | 第56-60页 |
5.3.1 滤波强度的Bs值并行求取与优化 | 第56-57页 |
5.3.2 环路滤波的并行进行与优化 | 第57-60页 |
5.4 环路滤波性能的评价 | 第60-61页 |
5.5 环路滤波结果分析 | 第61-64页 |
5.6 本章小结 | 第64-65页 |
第六章 基于GPU的并行解码器设计 | 第65-70页 |
6.1 H.264并行解码器计算复杂度分析 | 第65-67页 |
6.1.1 空间复杂度 | 第65-66页 |
6.1.2 时间复杂度 | 第66-67页 |
6.2 H.264并行解码器的计算瓶颈分析 | 第67页 |
6.3 解码器总体结果分析 | 第67-69页 |
6.4 本章小结 | 第69-70页 |
第七章 总结与展望 | 第70-73页 |
7.1 论文总结 | 第70-71页 |
7.2 后续展望 | 第71-73页 |
致谢 | 第73-74页 |
参考文献 | 第74-78页 |
附录 攻读硕士学位期间发表的学术论文 | 第78页 |