面向SPH流体模拟的异构并行计算方法

摘要	第6-7页
Abstract	第7页
第一章绪论	第13-21页
1.1 研究背景及意义	第13-14页
1.2 国内外研究现状	第14-18页
1.3 研究目标和内容	第18-19页
1.4 论文的研究内容及结构安排	第19-21页
第二章相关技术介绍	第21-32页
2.1 SPH方法	第21-23页
2.2 固定半径内邻居问题	第23-24页
2.3 GPGPU架构	第24-28页
2.3.1 GPU硬件	第24-26页
2.3.2 CUDA开发平台	第26-28页
2.4 SPH方法的GPGPU实现	第28-31页
2.4.1 传统实现方法	第29-30页
2.4.2 基于共享内存的方案	第30-31页
2.5 本章小结	第31-32页
第三章面向SPH方法的CPU-GPU异构计算框架	第32-43页
3.1 异构框架概要设计	第32-33页
3.2 任务分配与数据传输	第33-38页
3.3 负载均衡策略	第38-39页
3.4 实验结果	第39-42页
3.5 本章小结	第42-43页
第四章面向SPH方法的新GPGPU并行计算方法	第43-58页
4.1 针对L2 cache设计的并行任务分配方法	第43-46页
4.2 针对内存与线程层次结构设计的粒子交互方法	第46-49页
4.3 实验结果	第49-57页
4.3.1 新并行任务分配方法的性能与影响	第50-51页
4.3.2 新粒子交互方法的性能比较与分析	第51-57页
4.4 本章小结	第57-58页
第五章性能分析与优化策略	第58-76页
5.1 GPGPU程序性能分析模型	第59-66页
5.1.1 CWP-MWP模型	第60-62页
5.1.2 ITILP-ITMLP模型	第62-66页
5.2 SPH性能模型	第66-69页
5.2.1 传统方法(TRA)	第67-68页
5.2.2 已有的共享内存方案(PSMS)	第68-69页
5.2.3 新的粒子交互方法(NEW)	第69页
5.3 性能分析与比较	第69-75页
5.3.1 内存访问分析	第69-72页
5.3.2 隐藏内存获取与指令执行	第72-74页
5.3.3 设备占用率分析	第74-75页
5.4 本章小结	第75-76页
第六章结语	第76-78页
6.1 全文总结	第76页
6.2 未来工作	第76-78页
参考文献	第78-83页
致谢	第83-84页
研究成果	第84页