摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第18-31页 |
1.1 研究背景 | 第18-25页 |
1.1.1 GPU高性能计算概述 | 第18-22页 |
1.1.2 云计算概述 | 第22-24页 |
1.1.3 高性能计算云概述 | 第24页 |
1.1.4 高性能计算云环境下GPU计算面临挑战 | 第24-25页 |
1.2 研究动机 | 第25-26页 |
1.3 研究内容和创新点 | 第26-28页 |
1.3.1 研究内容 | 第26-28页 |
1.3.2 论文创新点 | 第28页 |
1.4 论文结构 | 第28-31页 |
第二章 国内外相关研究工作及分析 | 第31-45页 |
2.1 高性能计算云及其应用 | 第31-36页 |
2.1.1 高性能计算与云计算之间的差异 | 第31-32页 |
2.1.2 高性能计算云研究现状 | 第32-33页 |
2.1.3 高性能计算云的应用 | 第33-36页 |
2.2 基于GPU的高性能计算云及关键技术 | 第36-44页 |
2.2.1 高性能计算云中的虚拟化技术 | 第36-38页 |
2.2.2 GPU虚拟化技术 | 第38-39页 |
2.2.3 云计算中资源调度策略 | 第39-42页 |
2.2.4 GPU计算资源调度策略 | 第42-44页 |
2.3 本章总结 | 第44-45页 |
第三章 高性能计算云环境下多GPU计算资源调度机制 | 第45-64页 |
3.1 引言 | 第45-46页 |
3.2 建模和问题描述 | 第46-50页 |
3.2.1 GPU计算资源模型 | 第46-48页 |
3.2.2 多GPU计算任务模型 | 第48-50页 |
3.2.3 问题分析 | 第50页 |
3.3 系统架构 | 第50-51页 |
3.4 调度机制描述 | 第51-57页 |
3.4.1 多GPU负载模型 | 第52-55页 |
3.4.2 基于树型结构的GPU资源分布式检索算法 | 第55-57页 |
3.5 实验结果及性能分析 | 第57-62页 |
3.5.1 实验环境和设置 | 第57-59页 |
3.5.2 资源利用率分析 | 第59-60页 |
3.5.3 服务请求分析 | 第60-61页 |
3.5.4 服务质量分析 | 第61-62页 |
3.6 本章小结 | 第62-64页 |
第四章 高性能计算云环境下GPU通信机制研究 | 第64-83页 |
4.1 引言 | 第64页 |
4.2 高性能计算云环境下多GPU通信相关技术 | 第64-71页 |
4.2.1 GPU内线程通信 | 第65页 |
4.2.2 多GPU通信接口 | 第65-68页 |
4.2.3 云环境下虚拟机的计算通信 | 第68-71页 |
4.3 一种高性能计算云环境下GPU计算低延迟通信 | 第71-75页 |
4.3.1 云平台中GPU计算通信分析 | 第71-72页 |
4.3.2 改进的GPU计算低延迟通信策略 | 第72-74页 |
4.3.3 实时数据高复用策略 | 第74-75页 |
4.4 实验结果及性能分析 | 第75-81页 |
4.4.1 实验设置 | 第75页 |
4.4.2 有效性分析 | 第75-77页 |
4.4.3 可扩展性分析 | 第77页 |
4.4.4 数据松耦合交互应用测试 | 第77-79页 |
4.4.5 数据紧耦合交互应用测试 | 第79-81页 |
4.5 本章小结 | 第81-83页 |
第五章 基于GPU的量子搜索算法仿真研究 | 第83-102页 |
5.1 引言 | 第83-84页 |
5.2 量子计算的叠加性及量子搜索算法特点 | 第84-85页 |
5.3 一种压缩存储的量子搜索算法仿真 | 第85-94页 |
5.3.1 相关数据结构 | 第85-86页 |
5.3.2 算法仿真工作流 | 第86-88页 |
5.3.3 存储压缩优化 | 第88-89页 |
5.3.4 存储访问优化 | 第89-90页 |
5.3.5 实验数据与分析 | 第90-94页 |
5.4 通用量子搜索算法仿真 | 第94-100页 |
5.4.1 量子叠加性仿真 | 第95页 |
5.4.2 中间变量仿真 | 第95-97页 |
5.4.3 存储访问优化 | 第97-98页 |
5.4.4 实验结果 | 第98-100页 |
5.5 本章小结 | 第100-102页 |
第六章 基于GPU的三维断层成像重构研究 | 第102-122页 |
6.1 引言 | 第102-103页 |
6.2 基于输入-输出混合(HIO)算法的三维断层成像重构 | 第103-106页 |
6.2.1 混合型的输入-输出混合(HIO)算法 | 第103-104页 |
6.2.2 三维空间下的采样方案 | 第104页 |
6.2.3 非对称空间下的二维傅里叶变换 | 第104-105页 |
6.2.4 一种圆柱型的三维傅里叶变换 | 第105-106页 |
6.3 非对称傅里叶变换(NFT)的并行化策略 | 第106-112页 |
6.3.1 输入驱动方法下的数据集压缩 | 第107-108页 |
6.3.2 存储访问优化 | 第108-111页 |
6.3.3 聚集状采样点下的负载平衡策略 | 第111-112页 |
6.4 基于GPU的三维重构算法并行化方法 | 第112-114页 |
6.4.1 三维CFT计算 | 第112-113页 |
6.4.2 GPU中的计算流程 | 第113-114页 |
6.5 数值实验及分析 | 第114-121页 |
6.5.1 单精度下的NFT性能分析 | 第114-117页 |
6.5.2 双精度下的NFT中卷积步骤的性能分析 | 第117-118页 |
6.5.3 三维输入-输出混合(HIO)算法的性能分析 | 第118-120页 |
6.5.4 可用性测试 | 第120-121页 |
6.6 本章小结 | 第121-122页 |
第七章 结论与展望 | 第122-125页 |
7.1 论文研究工作总结 | 第122-124页 |
7.2 进一步工作展望 | 第124-125页 |
参考文献 | 第125-135页 |
致谢 | 第135-136页 |
在学期间的研究成果及发表的学术论文 | 第136-137页 |