第一章 绪论 | 第1-41页 |
·集群系统简介 | 第21-22页 |
·现阶段几种主要的集群网络简介 | 第22-25页 |
·高性能集群网络评测简介 | 第25-30页 |
·常用的并行通信模型及性能评测因子简介 | 第26-27页 |
·常用的性能测试程序简介 | 第27-29页 |
·常用的通信优化方法简介 | 第29-30页 |
·大规模科学计算性能测试与评估-LINPACK标准 | 第30页 |
·针对实际应用的大规模并行软件性能评估模型概述 | 第30-33页 |
·ScaLAPACK的性能预测模型 | 第32-33页 |
·大规模科学计算性能测试与评估-FFT标准 | 第33-38页 |
·Turkey-Cooley算法 | 第34-35页 |
·并行FFT | 第35-36页 |
·FFT性能分析 | 第36-37页 |
·FFT的软件实现 | 第37-38页 |
·与本文相关工作 | 第38页 |
·本文的主要工作 | 第38-41页 |
第二章 硬件因素对Beowulf Linux集群系统通信性能影响的研究 | 第41-53页 |
·常用的并行通信模型简介 | 第41-42页 |
·实验用系统的配置情况 | 第42页 |
·Beowulf Linux集群系统上的MPI基本行为分析 | 第42-44页 |
·节点计算部分对通信性能的影响 | 第44-46页 |
·网络部分对通信性能的影响 | 第46-51页 |
·百兆快速以太网.versus.Myrinet | 第46-48页 |
·单网卡.versus.双网卡 | 第48-51页 |
·结论和建议 | 第51-52页 |
·小结 | 第52-53页 |
第三章 大规模科学计算的性能测试与评估 | 第53-75页 |
·引言 | 第53-54页 |
·并行测试程序PARKBENCH | 第54页 |
·并行测试程序NPB(NAS Parallel Benchmarks) | 第54-65页 |
·NPB简介 | 第54-55页 |
·NPB测试方法论 | 第55-56页 |
·NPB 2.4 Class D的构建原则 | 第56页 |
·测试环境-LSSC2 | 第56-57页 |
·Block-Tridiagonal-BT | 第57-58页 |
·Conjugate Gradient-CG | 第58-59页 |
·Embarrassingly Parallel-EP | 第59-60页 |
·Fast Fourier Transform-FT | 第60-61页 |
·Lower-Upper Symmetric Gauss-Seidel-LU | 第61-62页 |
·Integer Sort-IS | 第62-63页 |
·Multigrid-MG | 第63-64页 |
·Scalar-Pentadiagonal-SP | 第64-65页 |
·并行测试程序NPB在大规模科学计算研究机群系统LSSC2上运行情况总结 | 第65-70页 |
·单节点性能小结 | 第65-68页 |
·总体性能小结 | 第68-70页 |
·NAS Parallel Benchmarks 2.4的残差检验和附表 | 第70-75页 |
第四章 对集群网络通信性能的热点测试 | 第75-103页 |
·引言 | 第76-77页 |
·Myrinet 2000上的热点测试 | 第77-86页 |
·Myrinet 2000上的发送/接收过程 | 第77-78页 |
·一个热点,三种策略 | 第78-84页 |
·2个热点测试程序 | 第84-86页 |
·测试平台 | 第86-87页 |
·简单的乒乓测试结果 | 第87页 |
·测试程序Pstab A和Pstab B的运行结果及分析 | 第87-94页 |
·从应用程序角度进行分析 | 第87-93页 |
·从通信协议角度看Myrinet 2000上的发送/接收指令 | 第93-94页 |
·三种策略对LogP模型参数影响 | 第94-95页 |
·三种策略对NAS Parallel Benchmarks的影响 | 第95-96页 |
·在其他一些集群网络(cLANs)上的测试结果 | 第96-97页 |
·TH-MyVIA-另一种构筑在Myrinet2000上的通信协议 | 第97-100页 |
·结论和展望 | 第100-103页 |
第五章 LINUX集群系统上的用户级通信 | 第103-117页 |
·简介 | 第103-104页 |
·已有的用户级通信协议及其分析 | 第104-110页 |
·用户级通信协议GAMMA的性能测试及其优缺点分析 | 第105页 |
·GAMMA的性能测试 | 第105-110页 |
·集群环境通信协议所需作的工作 | 第110-113页 |
·一个适用于小规模集群系统的用户级通信协议框架-‘TMachine’的分层,实现与策略 | 第113-115页 |
·下一步的工作 | 第115-117页 |
第六章 并行FFT算法的通信问题研究 | 第117-135页 |
·FFT并行算法简介 | 第118-123页 |
·并行FFT的数据分配方案 | 第119-120页 |
·并行FFT算法的通信行为调度 | 第120-121页 |
·影响并行FFT算法性能的一些主要因素 | 第121-123页 |
·一种对并行FFT算法内存体冲突进行改善的技术 | 第123-127页 |
·传统的FFT算法 | 第124-127页 |
·对旋转因子矩阵进行压缩的技术 | 第127-131页 |
·并行FFT算法的性能衡量指标 | 第131页 |
·一个典型的并行FFT算法-HFFT算法实例分析 | 第131-134页 |
·未来可以做的工作 | 第134-135页 |
第七章 总结和展望 | 第135-141页 |
·第2章 | 第135-136页 |
·第3章 | 第136-137页 |
·第4章 | 第137-139页 |
·第5章 | 第139-140页 |
·第6章 | 第140-141页 |
参考文献 | 第141-149页 |
攻读学位期间发表和接受的论文 | 第149-151页 |
致谢 | 第151-153页 |
作者简历 | 第153页 |