第一章 项目背景 | 第1-13页 |
·课题的来源和意义: | 第8-10页 |
·主要任务 | 第10页 |
·国内外研究现状: | 第10-13页 |
第二章 SMP集群 | 第13-24页 |
·集群 | 第13-17页 |
·集群的概念 | 第13-14页 |
·集群的重要指标 | 第14-17页 |
·对称多处理器(SMP,Symmetrical Multi-Processing) | 第17-18页 |
·Infiniband | 第18-19页 |
·Linux | 第19页 |
·21CMA集群的优化 | 第19-24页 |
·优化策略 | 第19-20页 |
·不同实现方法的比较 | 第20-22页 |
·使用Intel C Compiler | 第22-23页 |
·Linux 2.6.12内核带来的性能变化 | 第23-24页 |
第三章 性能优化方法的探讨 | 第24-30页 |
·性能优化的必要性 | 第24-25页 |
·性能优化方法的分析与讨论 | 第25-27页 |
·使用正确的工具 | 第27-30页 |
·Intel VTune performance Analyzer | 第27-29页 |
·Intel Performance Primitives | 第29页 |
·Intel Thread Check | 第29页 |
·Intel Thread Profiler | 第29-30页 |
第四章 MPI+OpenMP混合编程模型的实现 | 第30-42页 |
·MPI | 第30-31页 |
·OpenMP:基于命令的并行编程标准 | 第31-32页 |
·OpenMP+MPI混合编程模式 | 第32-35页 |
·混合编程模式的实现 | 第32-34页 |
·OpenMP+MPI混合编程模式的优缺点分析比较 | 第34-35页 |
·实际的测试以及结果分析 | 第35-37页 |
·实验基本环境 | 第35页 |
·Jacobi迭代实验 | 第35-36页 |
·通信与计算重叠实验 | 第36-37页 |
·试验结果分析 | 第37页 |
·混合模型对于21CMA的优化 | 第37-42页 |
第五章 相关器的优化 | 第42-50页 |
·相关算法的理论依据 | 第42-43页 |
·21CMA相关器的数据流程 | 第43-45页 |
·相关器主要部分的优化 | 第45-50页 |
·FFT模块的优化 | 第45页 |
·相关计算模块的优化策略 | 第45-46页 |
·相关模块的优化过程 | 第46-48页 |
·利用Cache重用原则 | 第48-50页 |
第六章 结束语 | 第50-53页 |
·目前数据分析成图的成果 | 第50-51页 |
·集群规模扩大 | 第51-52页 |
·未来工作的展望 | 第52-53页 |
参考文献 | 第53-56页 |
致谢 | 第56页 |