| 第一章 绪论 | 第1-41页 |
| ·集群系统简介 | 第21-22页 |
| ·现阶段几种主要的集群网络简介 | 第22-25页 |
| ·高性能集群网络评测简介 | 第25-30页 |
| ·常用的并行通信模型及性能评测因子简介 | 第26-27页 |
| ·常用的性能测试程序简介 | 第27-29页 |
| ·常用的通信优化方法简介 | 第29-30页 |
| ·大规模科学计算性能测试与评估-LINPACK标准 | 第30页 |
| ·针对实际应用的大规模并行软件性能评估模型概述 | 第30-33页 |
| ·ScaLAPACK的性能预测模型 | 第32-33页 |
| ·大规模科学计算性能测试与评估-FFT标准 | 第33-38页 |
| ·Turkey-Cooley算法 | 第34-35页 |
| ·并行FFT | 第35-36页 |
| ·FFT性能分析 | 第36-37页 |
| ·FFT的软件实现 | 第37-38页 |
| ·与本文相关工作 | 第38页 |
| ·本文的主要工作 | 第38-41页 |
| 第二章 硬件因素对Beowulf Linux集群系统通信性能影响的研究 | 第41-53页 |
| ·常用的并行通信模型简介 | 第41-42页 |
| ·实验用系统的配置情况 | 第42页 |
| ·Beowulf Linux集群系统上的MPI基本行为分析 | 第42-44页 |
| ·节点计算部分对通信性能的影响 | 第44-46页 |
| ·网络部分对通信性能的影响 | 第46-51页 |
| ·百兆快速以太网.versus.Myrinet | 第46-48页 |
| ·单网卡.versus.双网卡 | 第48-51页 |
| ·结论和建议 | 第51-52页 |
| ·小结 | 第52-53页 |
| 第三章 大规模科学计算的性能测试与评估 | 第53-75页 |
| ·引言 | 第53-54页 |
| ·并行测试程序PARKBENCH | 第54页 |
| ·并行测试程序NPB(NAS Parallel Benchmarks) | 第54-65页 |
| ·NPB简介 | 第54-55页 |
| ·NPB测试方法论 | 第55-56页 |
| ·NPB 2.4 Class D的构建原则 | 第56页 |
| ·测试环境-LSSC2 | 第56-57页 |
| ·Block-Tridiagonal-BT | 第57-58页 |
| ·Conjugate Gradient-CG | 第58-59页 |
| ·Embarrassingly Parallel-EP | 第59-60页 |
| ·Fast Fourier Transform-FT | 第60-61页 |
| ·Lower-Upper Symmetric Gauss-Seidel-LU | 第61-62页 |
| ·Integer Sort-IS | 第62-63页 |
| ·Multigrid-MG | 第63-64页 |
| ·Scalar-Pentadiagonal-SP | 第64-65页 |
| ·并行测试程序NPB在大规模科学计算研究机群系统LSSC2上运行情况总结 | 第65-70页 |
| ·单节点性能小结 | 第65-68页 |
| ·总体性能小结 | 第68-70页 |
| ·NAS Parallel Benchmarks 2.4的残差检验和附表 | 第70-75页 |
| 第四章 对集群网络通信性能的热点测试 | 第75-103页 |
| ·引言 | 第76-77页 |
| ·Myrinet 2000上的热点测试 | 第77-86页 |
| ·Myrinet 2000上的发送/接收过程 | 第77-78页 |
| ·一个热点,三种策略 | 第78-84页 |
| ·2个热点测试程序 | 第84-86页 |
| ·测试平台 | 第86-87页 |
| ·简单的乒乓测试结果 | 第87页 |
| ·测试程序Pstab A和Pstab B的运行结果及分析 | 第87-94页 |
| ·从应用程序角度进行分析 | 第87-93页 |
| ·从通信协议角度看Myrinet 2000上的发送/接收指令 | 第93-94页 |
| ·三种策略对LogP模型参数影响 | 第94-95页 |
| ·三种策略对NAS Parallel Benchmarks的影响 | 第95-96页 |
| ·在其他一些集群网络(cLANs)上的测试结果 | 第96-97页 |
| ·TH-MyVIA-另一种构筑在Myrinet2000上的通信协议 | 第97-100页 |
| ·结论和展望 | 第100-103页 |
| 第五章 LINUX集群系统上的用户级通信 | 第103-117页 |
| ·简介 | 第103-104页 |
| ·已有的用户级通信协议及其分析 | 第104-110页 |
| ·用户级通信协议GAMMA的性能测试及其优缺点分析 | 第105页 |
| ·GAMMA的性能测试 | 第105-110页 |
| ·集群环境通信协议所需作的工作 | 第110-113页 |
| ·一个适用于小规模集群系统的用户级通信协议框架-‘TMachine’的分层,实现与策略 | 第113-115页 |
| ·下一步的工作 | 第115-117页 |
| 第六章 并行FFT算法的通信问题研究 | 第117-135页 |
| ·FFT并行算法简介 | 第118-123页 |
| ·并行FFT的数据分配方案 | 第119-120页 |
| ·并行FFT算法的通信行为调度 | 第120-121页 |
| ·影响并行FFT算法性能的一些主要因素 | 第121-123页 |
| ·一种对并行FFT算法内存体冲突进行改善的技术 | 第123-127页 |
| ·传统的FFT算法 | 第124-127页 |
| ·对旋转因子矩阵进行压缩的技术 | 第127-131页 |
| ·并行FFT算法的性能衡量指标 | 第131页 |
| ·一个典型的并行FFT算法-HFFT算法实例分析 | 第131-134页 |
| ·未来可以做的工作 | 第134-135页 |
| 第七章 总结和展望 | 第135-141页 |
| ·第2章 | 第135-136页 |
| ·第3章 | 第136-137页 |
| ·第4章 | 第137-139页 |
| ·第5章 | 第139-140页 |
| ·第6章 | 第140-141页 |
| 参考文献 | 第141-149页 |
| 攻读学位期间发表和接受的论文 | 第149-151页 |
| 致谢 | 第151-153页 |
| 作者简历 | 第153页 |