基于CUDA平台的H.264视频编码器研究设计

摘要	第1-5页
ABSTRACT	第5-10页
图表清单	第10-13页
注释表	第13-14页
缩略词	第14-15页
第一章绪论	第15-21页
·课题研究背景及意义	第15-16页
·课题研究现状	第16-19页
·H.264 视频编码优化的国内外研究现状	第16-17页
·GPU 在视频编码应用中的国内外研究现状	第17-19页
·本文的主要工作及创新点	第19-20页
·论文组织结构	第20-21页
第二章 CUDA 计算平台及其性能优化	第21-35页
·GPU 通用计算	第21-23页
·CUDA 计算平台	第23-27页
·CUDA 硬件模型	第23-24页
·CUDA 编程模型	第24-26页
·CUDA 存储模型	第26-27页
·CUDA 平台性能优化	第27-34页
·任务划分设计	第27-28页
·存储器访问优化	第28-32页
·全局存储器访问优化	第28-30页
·共享存储器访问优化	第30-31页
·使用纹理存储器和常数存储器加速	第31-32页
·指令优化	第32-33页
·算术指令优化	第32页
·控制指令优化	第32-33页
·访存指令优化	第33页
·程序的异步执行	第33-34页
·小结	第34-35页
第三章 H.264 视频编码标准概述	第35-44页
·H.264 视频编码标准基本原理	第35-36页
·H.264 视频编码关键技术	第36-42页
·帧间预测	第36-38页
·帧内预测	第38-39页
·整数变换与量化	第39-40页
·熵编码	第40-41页
·去块滤波	第41-42页
·X264 开源编码器	第42-43页
·小结	第43-44页
第四章基于 CUDA 的 H.264 视频编码并行设计	第44-75页
·基于 CUDA 的 H.264 并行编码框架	第44-46页
·帧间预测的并行设计	第46-55页
·整像素运动估计实现	第46-50页
·4×4 子块的 SAD 值计算	第47-49页
·各种划分模式 SAD 值的合成	第49页
·获取最佳匹配结果	第49-50页
·分像素运动估计实现	第50-55页
·1/2 像素点与 1/4 像素点插值计算	第51-52页
·参考帧插值运算的并行执行	第52-54页
·分像素运动估计结果求取	第54-55页
·帧内预测的并行设计	第55-59页
·帧内预测的数据依赖关系	第55-57页
·改进的 4×4 子块执行顺序	第57-58页
·帧间预测的并行执行	第58-59页
·变换与量化的并行设计	第59-63页
·整数变换与量化	第60-62页
·变换与量化的并行执行	第62-63页
·熵编码的并行设计	第63-69页
·熵编码并行执行的局限性	第64-65页
·改进的 CAVLC 熵编码执行过程	第65-67页
·CAVLC 熵编码的并行执行	第67-69页
·去块滤波的并行设计	第69-74页
·去块滤波的数据依赖关系	第69-70页
·改进的去块滤波执行顺序	第70-73页
·去块滤波的并行执行	第73-74页
·小结	第74-75页
第五章编码器性能测试	第75-85页
·测试环境	第75-76页
·实验平台	第75-76页
·视频序列	第76页
·编码器各模块测试	第76-79页
·编码器整体性能测试	第79-84页
·小结	第84-85页
第六章总结与展望	第85-87页
·工作总结	第85-86页
·展望	第86-87页
参考文献	第87-92页
致谢	第92-93页
在学期间的研究成果及发表的学术论文	第93页