CPU-GPU异构平台计算模型的研究与应用
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-13页 |
| ·研究背景和意义 | 第8-10页 |
| ·研究现状 | 第10-11页 |
| ·CPU-GPU异构计算的研究现状 | 第10页 |
| ·CPU-GPU异构计算模型的研究现状 | 第10-11页 |
| ·本文的研究内容和主要工作 | 第11-12页 |
| ·研究内容及任务 | 第12-13页 |
| 2 OpenCL与GPU编程优化 | 第13-24页 |
| ·AMD流处理器体系结构 | 第13-15页 |
| ·OpenCL架构 | 第15-19页 |
| ·平台模型 | 第15-16页 |
| ·执行模型 | 第16-17页 |
| ·内存模型 | 第17-18页 |
| ·编程模型 | 第18-19页 |
| ·OpenCL性能优化 | 第19-24页 |
| ·数据传输优化 | 第19-20页 |
| ·资源利用优化 | 第20页 |
| ·访存优化 | 第20-22页 |
| ·指令优化 | 第22-24页 |
| 3 基于CPU-GPU异构平台的计算模型 | 第24-35页 |
| ·模型架构与特点 | 第24-26页 |
| ·模型的提出 | 第24页 |
| ·模型架构与特点 | 第24-26页 |
| ·系统模型 | 第26-32页 |
| ·任务数据划分 | 第27-29页 |
| ·任务评价 | 第29-31页 |
| ·数据调度处理 | 第31-32页 |
| ·接口模型 | 第32-34页 |
| ·计算模型总结 | 第34-35页 |
| 4 模型实现与性能优化 | 第35-50页 |
| ·矩阵乘法的实现与优化 | 第35-40页 |
| ·矩阵乘法的模型实现 | 第35-37页 |
| ·矩阵乘法的性能优化 | 第37-40页 |
| ·三角矩阵求逆的实现与优化 | 第40-43页 |
| ·三角矩阵求逆的模型实现 | 第40-42页 |
| ·三角矩阵求逆的性能优化 | 第42-43页 |
| ·求解稠密线程方程组的实现与优化 | 第43-49页 |
| ·LU分解及其分块算法 | 第43-46页 |
| ·求解稠密线程方程组的模型实现 | 第46-47页 |
| ·Right-looking算法的性能优化 | 第47-49页 |
| ·本章小结 | 第49-50页 |
| 5 性能测试与分析 | 第50-56页 |
| ·矩阵乘法的性能测试与分析 | 第50-52页 |
| ·三角矩阵求逆的性能测试与分析 | 第52-54页 |
| ·稠密线性方程组的性能测试与分析 | 第54-56页 |
| 6 结论与展望 | 第56-57页 |
| 参考文献 | 第57-60页 |
| 致谢 | 第60-61页 |