首页--工业技术论文--无线电电子学、电信技术论文--通信论文--数据通信论文--图像通信、多媒体通信论文--图像编码论文

面向应用的GPU并行计算关键技术研究

摘要第1-14页
ABSTRACT第14-17页
第一章 绪论第17-39页
   ·课题背景第18-29页
     ·基于GPU的高性能计算系统第18-25页
     ·GPU并行计算可能面临的技术挑战第25-29页
   ·相关研究第29-33页
     ·基于GPU的并行程序设计相关研究第29-31页
     ·性能分析预测模型相关研究第31-32页
     ·异构体系结构间可移植性相关研究第32-33页
   ·本文主要研究内容及创新点第33-36页
   ·论文结构第36-39页
第二章 基于GPU的高效并行视频编码框架与实现第39-67页
   ·引言第39-41页
   ·相关研究第41-43页
   ·并行H.264 编码框架第43-46页
     ·H.264/AVC编码器结构剖析第43-44页
     ·以帧为单位的循环分割第44页
     ·数组结构到结构数组的转换,提高带宽利用率第44-45页
     ·全应用GPU并行,开发生产者消费者局域性第45-46页
   ·帧间预测: 可扩展多分辨率多窗口算法第46-49页
   ·非规则算法的高效并行实现方案第49-59页
     ·多级并行帧内预测第49-51页
     ·分量并行CAVLC第51-56页
     ·方向优先的去块滤波第56-59页
   ·实验评估与分析第59-66页
     ·实验设置和测试序列第59页
     ·率失真性能评估第59-60页
     ·加速性能分析第60-64页
     ·时间分布分析第64-66页
   ·小结第66-67页
第三章 基于CPU-GPU异构系统的高效双岩沉降模拟解决方案第67-89页
   ·引言第67-68页
   ·数学模型和数值方法第68-71页
   ·并行实现设计第71-78页
     ·基于MPI的CPU-only实现第71页
     ·GPU-only实现第71-75页
     ·CPU-GPU混合实现第75-78页
   ·实验评估与分析第78-86页
     ·实验设置和结果第78-80页
     ·单GPU性能比较与分析第80-81页
     ·扩展性评测第81-84页
     ·时间分布第84-86页
   ·小结第86-89页
第四章 基于数据传输的Stencil计算GPU性能预测模型第89-119页
   ·引言第89-90页
   ·NVIDIA GPU体系结构第90-92页
   ·量化性能分析第92-100页
     ·Stencil计算第92-93页
     ·L1 cache以及线程块形状对Stencil性能的影响第93-95页
     ·Padding的影响第95-97页
     ·空间分块技术第97-100页
     ·时间分块技术第100页
   ·性能模型第100-109页
     ·寄存器和片上存储器之间数据传输量模型第101-102页
     ·片上存储器和L2 cache之间数据传输量模型第102-104页
     ·L2 cache和全局存储器之间数据传输量模型第104-105页
     ·模型示例说明第105页
     ·模型扩展第105-109页
     ·局限性第109页
   ·实验评估第109-117页
     ·实验设置第109-110页
     ·基于基本实现的模型评估第110-113页
     ·基于 3D分块优化实现程序的模型评估第113-117页
   ·相关研究第117-118页
   ·小结第118-119页
第五章 Open CL Stencil计算在CPU-GPU之间的性能可移植性研究第119-135页
   ·引言第119-120页
   ·Open CL编程第120-122页
   ·Stencil计算的Open CL实现与优化第122-127页
     ·基本实现第122-123页
     ·基于数据分块的性能增强第123-124页
     ·面向GPU的优化:基于寄存器重用的 3D分块第124-126页
     ·使用本地存储器第126页
     ·时间分块技术第126-127页
   ·实验评测第127-133页
     ·3D Stencil计算第127-128页
     ·实验设置第128-129页
     ·GPU上的性能评测第129-132页
     ·CPU上的性能评估第132-133页
   ·相关研究第133-134页
   ·小结第134-135页
第六章 结论与展望第135-139页
   ·工作总结第135-137页
   ·未来的研究方向第137-139页
致谢第139-141页
参考文献第141-157页
作者在学期间取得的学术成果第157-160页
 学术论文第157-159页
 学术专著第159页
 专利第159页
 软件著作权第159-160页
 作者在学期间参与的科研工作第160页

论文共160页,点击 下载论文
上一篇:正弦调频傅里叶变换方法及雷达目标微动特性反演技术研究
下一篇:面向云存储的数据完整性验证技术研究