声明 | 第1页 |
关于论文使用授权的说明 | 第3-4页 |
摘要 | 第4-6页 |
ABSTRACT | 第6-14页 |
第一章 引言 | 第14-32页 |
·并行计算及其分类 | 第14-15页 |
·高性能计算的现状和发展趋势 | 第15-18页 |
·互连网络的特征 | 第18-24页 |
·网络拓扑结构 | 第19-20页 |
·交换方式 | 第20-22页 |
(1) 电路交换(Circuit switching) | 第20-21页 |
(2) 存储转发交换(store-and-forward switching) | 第21页 |
(3) 虚穿透(Virtual Cut-Through)交换 | 第21页 |
(4) 虫洞(Wormhole)交换 | 第21-22页 |
(5) 其他交换方式 | 第22页 |
·流控机制 | 第22-23页 |
·路由算法 | 第23-24页 |
·网络通信的量化指标 | 第24-27页 |
·带宽(bandwidth) | 第24页 |
·传输延时 | 第24页 |
·不同交换方式对网络延时的影响 | 第24-26页 |
·网络阻塞对传输延时的影响 | 第26-27页 |
·机群互连网络的要求 | 第27-28页 |
·高性能 | 第27页 |
·可扩展 | 第27页 |
·高可用 | 第27页 |
·可移植 | 第27-28页 |
·对其他数据传输方式的支持 | 第28页 |
·本文主要贡献与创新 | 第28-30页 |
·本文的主要工作 | 第28-29页 |
·创新点 | 第29-30页 |
·论文的组织 | 第30-32页 |
第二章 互连网络的研究现状 | 第32-44页 |
·互连网络交换机和路由器 | 第32-34页 |
·内部交换结构 | 第32-33页 |
·调度算法 | 第33-34页 |
·紧耦合系统互连网络 | 第34-38页 |
·CrayLink 网络 | 第34-36页 |
·Gigaplane-XB 网络 | 第36-37页 |
·紧耦合系统的延时和带宽性能 | 第37-38页 |
·机群互连网络 | 第38-43页 |
·Myrinet | 第38-39页 |
·SCI | 第39-40页 |
·Quadrics | 第40-41页 |
·InfiniBand | 第41-42页 |
·机群互连网络的带宽和延时性能 | 第42-43页 |
·互连网络研究现状小结 | 第43-44页 |
第三章 通信对机群并行性能的影响 | 第44-62页 |
·并行计算的基本概念 | 第44-53页 |
·并行性能的衡量指标 | 第44-46页 |
(1) Amdahl 定律 | 第44-45页 |
(2) 使用Amdahl 定律的条件 | 第45页 |
(3) Amdahl 定律的局限 | 第45-46页 |
·并行计算模型 | 第46-48页 |
(1) PRAM 模型 | 第46-47页 |
(2) BSP 模型 | 第47页 |
(3) LogP 模型 | 第47-48页 |
·并行编程模型 | 第48-51页 |
(1) 数据并行 | 第48页 |
(2) 消息传递 | 第48-49页 |
(3) 共享存储 | 第49-51页 |
·机群与虚拟共享存储 | 第51-53页 |
(1) 机群 | 第51-52页 |
(2) 虚拟共享存储 | 第52页 |
(3) 机群上实现的虚拟共享存储 | 第52-53页 |
·通信对机群并行计算性能的影响 | 第53-61页 |
·测试环境 | 第53-55页 |
(1) MPI | 第54页 |
(2) JIAJIA | 第54-55页 |
·测试环境的底层通信性能 | 第55页 |
·减小通信时间,提高并行性能的方法 | 第55-61页 |
(1) 采用高速网络,减小消息延时和消息发送间隔 | 第56-58页 |
(2) 采用用户级通信协议,减小系统开销和协议开销 | 第58页 |
(3) 利用SMP 通信,减小消息延时,增大通信带宽 | 第58-59页 |
(4) 动态预取或迁移数据,改善数据局部性或使计算和通信更好地重叠 | 第59-60页 |
(5) 合并同时传送的消息,减少消息数量 | 第60-61页 |
·小结 | 第61-62页 |
第四章 机群互连网络设计 | 第62-68页 |
·FRAMP 互连网络的要求 | 第62页 |
·数据交换方式 | 第62-63页 |
·流量控制和路由 | 第63-64页 |
·传输链路 | 第64页 |
·通信协议 | 第64-66页 |
·分组和帧格式 | 第66-67页 |
·小结 | 第67-68页 |
第五章 机群交换机的设计和实现 | 第68-84页 |
·机群交换机的设计 | 第68-72页 |
·交换机的结构 | 第68-69页 |
·交换方式的选择 | 第69-70页 |
·缓冲的选择 | 第70页 |
(1) 电路交换方式下的“缓冲” | 第70页 |
(2) 穿透交换方式下的缓冲 | 第70页 |
·交换机调度算法 | 第70-72页 |
·机群交换机的实现 | 第72-82页 |
·交换机的总体结构 | 第72-73页 |
·端口控制器 | 第73-75页 |
·交换和调度单元的FPGA 实现 | 第75-82页 |
(1) 电路交换方式的实现 | 第75-76页 |
(2) 穿透交换方式的实现 | 第76-77页 |
(3) 输入纯FIFO 缓冲 | 第77-78页 |
(4) 交换机的调度算法 | 第78-80页 |
(5) 交换机的流量控制 | 第80-81页 |
(6) 交换机延时 | 第81-82页 |
·FRAMP 交换机设计和实现小结 | 第82-84页 |
第六章 FRAMP 网络接口的设计和实现 | 第84-94页 |
·FRAMP 数据传输机制 | 第84-85页 |
·FRAMP 网络接口的总体设计 | 第85页 |
·PCI 接口控制器 | 第85-86页 |
·FIFO 缓冲器 | 第86-87页 |
·收发驱动和链路信号 | 第87-88页 |
·FRAMP 网卡上的FPGA | 第88-92页 |
·总线仲裁 | 第89-90页 |
·消息发送和接收过程 | 第90页 |
·RDMA 写传输过程 | 第90-91页 |
·RDMA 读传输过程 | 第91页 |
·TLB 查找和更新逻辑 | 第91-92页 |
·小结 | 第92-94页 |
第七章 FRAMP 互连网络的测试和评价 | 第94-116页 |
·FRAMP 互连网络的测试和评价 | 第94-106页 |
·FRAMP 互连网络的非量化指标评价 | 第94-95页 |
·FRAMP 交换机的性能 | 第95-96页 |
(1) 端口带宽 | 第95页 |
(2) 交换延时 | 第95-96页 |
·FRAMP 网络接口到网络接口的数据传输延时 | 第96-97页 |
·FRAMP 底层硬件性能 | 第97-102页 |
(1) 小消息延时 | 第97-99页 |
(2) 大消息带宽 | 第99-101页 |
(3) LogGP 模型的参数值 | 第101页 |
(4) RDMA 写和读的延迟 | 第101-102页 |
·FRAMP API 性能 | 第102-106页 |
(1) 主要API 函数的延时 | 第102-104页 |
(2) 主要API 函数的带宽 | 第104页 |
(3) 与国内外同类系统的比较 | 第104-106页 |
·用FRAMP 网络连接的虚拟共享存储机群系统的性能评测 | 第106-113页 |
·机群并行应用程序访存行为的虚拟层次结构 | 第107-110页 |
(1) 特殊情况下访存行为的虚拟层次结构的数学描述 | 第107-108页 |
(2) 访存行为虚拟层次结构的例子 | 第108-109页 |
(2) 访存行为虚拟层次结构数学表示的使用条件和扩展 | 第109-110页 |
·应用程序在FRAMP 网络上的并行性能 | 第110-113页 |
(1) 硬件和软件环境 | 第110页 |
(2) 测试程序介绍 | 第110-111页 |
(3) 应用程序的实测性能 | 第111-112页 |
(4) 应用程序在FRAMP 与百兆以太网上的性能比较 | 第112页 |
(5) FRAMP 网络与Myrinet 和SCI 的性能比较 | 第112-113页 |
·FRAMP 网络评测小结 | 第113-116页 |
第八章 结论和进一步工作 | 第116-118页 |
·本文工作的总结 | 第116-117页 |
·未来的工作 | 第117-118页 |
参考文献 | 第118-127页 |
致 谢 | 第127-128页 |
作者简历 | 第128页 |