摘要 | 第5-6页 |
abstract | 第6-7页 |
第一章 绪论 | 第10-14页 |
1.1 工作背景 | 第10页 |
1.2 并行时代的来临 | 第10-12页 |
1.2.1 功率密度的飙升 | 第10-11页 |
1.2.2 多核计算机的出现 | 第11-12页 |
1.3 论文所作的工作 | 第12-13页 |
1.4 论文的结构安排 | 第13-14页 |
第二章 TBB及其并行环境简介 | 第14-23页 |
2.1 TBB的优势 | 第14-16页 |
2.1.1 与裸线程和MPI的比较 | 第15页 |
2.1.2 与OpenMP的比较 | 第15-16页 |
2.2 Intel Parallel Studio简介 | 第16-22页 |
2.2.1 Parallel Advisior的工作流程 | 第17-18页 |
2.2.2 Parallel Composer XE简介 | 第18-19页 |
2.2.3 VTune Amplifier XE简介 | 第19-20页 |
2.2.4 Parallel Inspector XE | 第20-22页 |
2.3 本章小结 | 第22-23页 |
第三章 串行代码结构及线程构建模块简介 | 第23-32页 |
3.1 串行代码简介 | 第23-25页 |
3.2 串行代码的修改 | 第25-26页 |
3.2.1 数组类型为网格 | 第25页 |
3.2.2 数组类型为粒子 | 第25-26页 |
3.3 TBB线程构建模块简介 | 第26-31页 |
3.3.1 循环并行化 | 第26-30页 |
3.3.2 任务调度器并行 | 第30-31页 |
3.4 本章小结 | 第31-32页 |
第四章 1D3V粒子模拟软件BUMBLEBEE的并行算法 | 第32-49页 |
4.1 BUMBLEBEE串行代码的热点分析 | 第32-34页 |
4.2 BUMBLEBEE的并行 | 第34-48页 |
4.2.1 并行中的安全性 | 第34-37页 |
4.2.2 并行算法 | 第37-41页 |
4.2.3 并行加速比 | 第41-46页 |
4.2.4 可扩展性 | 第46-48页 |
4.3 本章小结 | 第48-49页 |
第五章 结果分析 | 第49-59页 |
5.1 引言 | 第49页 |
5.2 运行结果分析 | 第49-58页 |
5.2.1 场分布对比 | 第50-55页 |
5.2.2 粒子分布特性对比 | 第55-58页 |
5.3 总结 | 第58-59页 |
第六章 总结与展望 | 第59-60页 |
致谢 | 第60-61页 |
参考文献 | 第61-63页 |