| 第一章 项目背景 | 第1-13页 |
| ·课题的来源和意义: | 第8-10页 |
| ·主要任务 | 第10页 |
| ·国内外研究现状: | 第10-13页 |
| 第二章 SMP集群 | 第13-24页 |
| ·集群 | 第13-17页 |
| ·集群的概念 | 第13-14页 |
| ·集群的重要指标 | 第14-17页 |
| ·对称多处理器(SMP,Symmetrical Multi-Processing) | 第17-18页 |
| ·Infiniband | 第18-19页 |
| ·Linux | 第19页 |
| ·21CMA集群的优化 | 第19-24页 |
| ·优化策略 | 第19-20页 |
| ·不同实现方法的比较 | 第20-22页 |
| ·使用Intel C Compiler | 第22-23页 |
| ·Linux 2.6.12内核带来的性能变化 | 第23-24页 |
| 第三章 性能优化方法的探讨 | 第24-30页 |
| ·性能优化的必要性 | 第24-25页 |
| ·性能优化方法的分析与讨论 | 第25-27页 |
| ·使用正确的工具 | 第27-30页 |
| ·Intel VTune performance Analyzer | 第27-29页 |
| ·Intel Performance Primitives | 第29页 |
| ·Intel Thread Check | 第29页 |
| ·Intel Thread Profiler | 第29-30页 |
| 第四章 MPI+OpenMP混合编程模型的实现 | 第30-42页 |
| ·MPI | 第30-31页 |
| ·OpenMP:基于命令的并行编程标准 | 第31-32页 |
| ·OpenMP+MPI混合编程模式 | 第32-35页 |
| ·混合编程模式的实现 | 第32-34页 |
| ·OpenMP+MPI混合编程模式的优缺点分析比较 | 第34-35页 |
| ·实际的测试以及结果分析 | 第35-37页 |
| ·实验基本环境 | 第35页 |
| ·Jacobi迭代实验 | 第35-36页 |
| ·通信与计算重叠实验 | 第36-37页 |
| ·试验结果分析 | 第37页 |
| ·混合模型对于21CMA的优化 | 第37-42页 |
| 第五章 相关器的优化 | 第42-50页 |
| ·相关算法的理论依据 | 第42-43页 |
| ·21CMA相关器的数据流程 | 第43-45页 |
| ·相关器主要部分的优化 | 第45-50页 |
| ·FFT模块的优化 | 第45页 |
| ·相关计算模块的优化策略 | 第45-46页 |
| ·相关模块的优化过程 | 第46-48页 |
| ·利用Cache重用原则 | 第48-50页 |
| 第六章 结束语 | 第50-53页 |
| ·目前数据分析成图的成果 | 第50-51页 |
| ·集群规模扩大 | 第51-52页 |
| ·未来工作的展望 | 第52-53页 |
| 参考文献 | 第53-56页 |
| 致谢 | 第56页 |