摘要 | 第5-7页 |
Abstract | 第7-9页 |
1 绪论 | 第12-18页 |
1.1 研究背景和意义 | 第12-13页 |
1.2 国内外相关领域研究现状 | 第13-16页 |
1.2.1 通用并行计算 | 第13-15页 |
1.2.2 并行计算性能评价模型 | 第15页 |
1.2.3 虚拟现实系统并行计算 | 第15-16页 |
1.3 本文组织结构 | 第16-18页 |
2 通用并行计算技术研究 | 第18-56页 |
2.1 并行计算性能评价模型 | 第19-27页 |
2.1.1 基于阿姆达尔定律的性能评价理论模型 | 第19-20页 |
2.1.2 性能指标的选定及其准确度的考虑 | 第20-23页 |
2.1.3 并行计算多方案交叉对比改进性能评价模型 | 第23-27页 |
2.2 基于 SSE 面向 CPU 的通用并行计算 | 第27-35页 |
2.2.1 OpenMP 多线程任务级并行 | 第27-30页 |
2.2.2 线程内 SSE 指令级并行 | 第30-31页 |
2.2.3 OpenMP 与 SSE 双层嵌套并行 | 第31-35页 |
2.3 基于 OpenCL 面向 CPU 和 GPU 的异构通用并行计算 | 第35-41页 |
2.3.1 OpenCL 技术概览 | 第35-38页 |
2.3.2 OpenCL 的异构特性和可移植性 | 第38-39页 |
2.3.3 OpenCL 版本的加权图像变换算法实现 | 第39-40页 |
2.3.4 OpenCL 算法性能分析 | 第40-41页 |
2.4 基于 GLSL 的 GPGPU 通用并行计算 | 第41-46页 |
2.4.1 顶点着色器语言 Shading Language 简介 | 第41-43页 |
2.4.2 着色器语言编程规范 | 第43-46页 |
2.5 基于 CUDA 的 GPGPU 通用并行计算 | 第46-54页 |
2.5.1 统一计算设备架构 CUDA 简介 | 第46-47页 |
2.5.2 CUDA 编程模型的设计特色 | 第47-54页 |
2.6 本章小结 | 第54-56页 |
3 骨骼动画渲染算法在 CPU 上的并行计算 | 第56-78页 |
3.1 骨骼动画矩阵调色板算法 | 第56-63页 |
3.1.1 为骨骼动画渲染算法建模 | 第56-60页 |
3.1.2 串行算法性能分析和瓶颈定位 | 第60-63页 |
3.2 基于 SSE 面向 CPU 的骨骼动画矩阵调色板算法 | 第63-68页 |
3.2.1 OpenMP 多线程并行 | 第63-65页 |
3.2.2 基于 SSE 的线程内指令并行 | 第65-67页 |
3.2.3 线程与指令双层并行 | 第67-68页 |
3.3 基于 OpenCL 面向 CPU 的骨骼动画矩阵调色板算法 | 第68-77页 |
3.3.1 矩阵调色板算法从 SSE 移植到 OpenCL | 第68-72页 |
3.3.2 OpenCL 与 OpenGL 互操作 | 第72-77页 |
3.4 实验结果分析和本章小结 | 第77-78页 |
4 骨骼动画渲染算法在 GPU 上的并行计算 | 第78-101页 |
4.1 基于 GLSL 面向 GPU 的骨骼动画矩阵调色板算法 | 第78-81页 |
4.1.1 GLSL 骨骼动画算法移植 | 第78-80页 |
4.1.2 GLSL 骨骼动画算法性能分析 | 第80-81页 |
4.2 基于 CUDA 面向 GPU 的骨骼动画矩阵调色板算法 | 第81-96页 |
4.2.1 未经优化并且功能简化的初步算法 | 第81-85页 |
4.2.2 完善算法实现对多骨骼的支持 | 第85-88页 |
4.2.3 根据 CUDA 硬件特性和算法特性优化算法 | 第88-94页 |
4.2.4 CUDA 算法性能分析 | 第94-96页 |
4.3 基于 OpenCL 面向 GPU 的骨骼动画矩阵调色板算法 | 第96-98页 |
4.4 实验结果分析和本章小结 | 第98-101页 |
5 面向虚拟现实系统的多任务异构协同并行计算 | 第101-111页 |
5.1 基于柏林噪声风场扰动的喷泉粒子系统模拟 | 第101-108页 |
5.1.1 喷泉粒子系统模拟 | 第101-105页 |
5.1.2 柏林噪声风场扰动 | 第105-107页 |
5.1.3 性能瓶颈分析 | 第107页 |
5.1.4 OpenCL 并行计算 | 第107-108页 |
5.2 CPU 与 GPU 异构协同处理 VR 系统多任务 | 第108-110页 |
5.2.1 相同粒度的多节点并行计算系统 | 第109页 |
5.2.2 不同粒度的多节点并行计算系统 | 第109-110页 |
5.3 本章小结 | 第110-111页 |
6 总结和展望 | 第111-114页 |
6.1 总结 | 第111-112页 |
6.2 展望 | 第112-114页 |
参考文献 | 第114-124页 |
研究成果 | 第124-126页 |
致谢 | 第126-127页 |