摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第1章 绪论 | 第10-20页 |
·并行计算 | 第10-15页 |
·并行计算概述 | 第10-11页 |
·当代并行计算机体系结构及发展趋势 | 第11-14页 |
·通信在并行计算中作用 | 第14-15页 |
·MPI 并行编程模型 | 第15-17页 |
·主流并行编程模型 | 第15-16页 |
·消息传递模型MPI 概述 | 第16-17页 |
·KD60 高性能集群 | 第17-18页 |
·硬件体系结构与网络拓扑 | 第17-18页 |
·软件系统结构以及并行计算环境 | 第18页 |
·本文工作 | 第18-20页 |
·本文工作 | 第18页 |
·章节安排 | 第18-20页 |
第2章 多核体系下的通信 | 第20-27页 |
·概述 | 第20页 |
·多核系统架构 | 第20-23页 |
·CMP 架构 | 第20-21页 |
·主流商用多核处理器 | 第21-23页 |
·多核体系下的通信特征 | 第23-26页 |
·三种层次的通信 | 第23-25页 |
·多核体系下的通信分析模型 | 第25-26页 |
·本章小结 | 第26-27页 |
第3章 MPICH2 通信库概述 | 第27-36页 |
·概述 | 第27页 |
·MPI-2 标准 | 第27-29页 |
·MPICH2 层次结构及各模块实现 | 第29-33页 |
·层次结构 | 第29-31页 |
·MPICH2 底层通信模块Nemsis 实现 | 第31-33页 |
·MPICH2 实现中的若干问题 | 第33-34页 |
·性能以及扩展性 | 第33-34页 |
·群集通信 | 第34页 |
·本章小结 | 第34-36页 |
第4章 点到点通信优化 | 第36-50页 |
·概述 | 第36页 |
·点到点通信介绍 | 第36-38页 |
·实现 | 第36-38页 |
·点到点通信优化相关工作 | 第38页 |
·集群网络性能优化 | 第38-41页 |
·TCP 网络参数调优 | 第38-39页 |
·网卡校验和的卸载 | 第39-40页 |
·优化结果 | 第40-41页 |
·节点内点到点通信性能优化 | 第41-49页 |
·数据切片技术的应用 | 第41-44页 |
·利用龙芯128 位访存指令改进memcpy 效率 | 第44-46页 |
·单拷贝技术的应用 | 第46-47页 |
·优化结果 | 第47-49页 |
·本章小结 | 第49-50页 |
第5章 群集通信性能优化 | 第50-62页 |
·概述 | 第50-51页 |
·群集通信介绍 | 第51-52页 |
·群集通信原有实现概述 | 第51-52页 |
·群集通信优化的相关工作 | 第52页 |
·一到多模式群集通信函数(MPI_Bcast 为例)优化 | 第52-56页 |
·MPI_Bcast 原算法实现及其不足 | 第52-54页 |
·优化算法实现及其理论分析 | 第54-56页 |
·优化结果 | 第56页 |
·多到多模式群集通信函数(MPI_Alltoall 为例)优化 | 第56-61页 |
·MPI_Alltoall 原算法实现及其不足 | 第56-57页 |
·优化算法实现及其分析 | 第57-59页 |
·优化效果 | 第59-61页 |
·本章小结 | 第61-62页 |
第6章 总结 | 第62-64页 |
·本文工作 | 第62-63页 |
·本文贡献与创新点 | 第63页 |
·未来工作 | 第63-64页 |
参考文献 | 第64-68页 |
附录 A 插图索引 | 第68-69页 |
附录 B 表格索引 | 第69-70页 |
致谢 | 第70-71页 |
参加的科研项目和发表的论文 | 第71页 |
参加的科研项目 | 第71页 |
已录用的论文 | 第71页 |