基于双GPU加速粒子系统模拟的研究
摘要 | 第3-4页 |
ABSTRACT | 第4页 |
第1章 引言 | 第7-11页 |
1.1 选题的背景及意义 | 第7-8页 |
1.2 国内外研究现状 | 第8-9页 |
1.3 主要研究内容 | 第9-10页 |
1.4 论文总体组织结构 | 第10-11页 |
第2章 GPU编程与DEM原理概述 | 第11-20页 |
2.1 CPU与GPU异构编程 | 第11-16页 |
2.1.1 CPU、GPU的区别 | 第11-13页 |
2.1.2 CUDA存储器简介 | 第13-14页 |
2.1.3 CUDA程序设计语言 | 第14-15页 |
2.1.4 程序基本框架 | 第15页 |
2.1.5 CUDA程序测时 | 第15-16页 |
2.2 DEM概述 | 第16-18页 |
2.2.1 法向力处理 | 第16-17页 |
2.2.2 切线方向及合力的计算 | 第17-18页 |
2.2.3 蛙跳积分 | 第18页 |
2.3 本章小结 | 第18-20页 |
第3章 单GPU端的设计分析与改进 | 第20-31页 |
3.1 HOST端设计 | 第20-22页 |
3.1.1 封装的数据 | 第20-21页 |
3.1.2 封装的函数方法 | 第21-22页 |
3.2 DEVICE端设计 | 第22-25页 |
3.2.1 线程的宏观划分 | 第22页 |
3.2.2 邻域搜索的实现 | 第22-25页 |
3.2.3 碰撞检测与碰撞处理 | 第25页 |
3.3 改进措施 | 第25-30页 |
3.3.1 改进的原因及可行性分析 | 第25-26页 |
3.3.2 改进方案 | 第26-29页 |
3.3.3 改进在双GPU端的适用性分析 | 第29-30页 |
3.4 本章小结 | 第30-31页 |
第4章 双GPU端的设计 | 第31-40页 |
4.1 前人工作分析 | 第31-33页 |
4.2 详细设计方案 | 第33-37页 |
4.2.1 总体设计思路 | 第33-34页 |
4.2.2 HOST端 | 第34-35页 |
4.2.3 DEVICE端 | 第35-37页 |
4.3 数据交互模型 | 第37-39页 |
4.4 本章小结 | 第39-40页 |
第5章 实验结果与分析 | 第40-51页 |
5.1 模拟环境与效果图 | 第40-42页 |
5.2 邻域搜索实验分析 | 第42-46页 |
5.2.1 过程中调用函数比较 | 第42-43页 |
5.2.2 实验结果 | 第43-45页 |
5.2.3 结果分析 | 第45-46页 |
5.3 双GPU端实验分析与结果 | 第46-50页 |
5.3.1 ghost data的选取 | 第46-47页 |
5.3.2 不同数据交互模型 | 第47-48页 |
5.3.3 理论结果分析 | 第48-49页 |
5.3.4 实验结果 | 第49-50页 |
5.4 本章小结 | 第50-51页 |
第6章 全文总结 | 第51-53页 |
6.1 研究成果和结论 | 第51页 |
6.2 下一步工作 | 第51-53页 |
致谢 | 第53-54页 |
参考文献 | 第54-57页 |
攻读学位期间的研究成果 | 第57页 |