共享虚拟存储机群高速互连网络研究

声明	第1页
关于论文使用授权的说明	第3-4页
摘要	第4-6页
ABSTRACT	第6-14页
第一章引言	第14-32页
·并行计算及其分类	第14-15页
·高性能计算的现状和发展趋势	第15-18页
·互连网络的特征	第18-24页
·网络拓扑结构	第19-20页
·交换方式	第20-22页
(1) 电路交换(Circuit switching)	第20-21页
(2) 存储转发交换(store-and-forward switching)	第21页
(3) 虚穿透(Virtual Cut-Through)交换	第21页
(4) 虫洞(Wormhole)交换	第21-22页
(5) 其他交换方式	第22页
·流控机制	第22-23页
·路由算法	第23-24页
·网络通信的量化指标	第24-27页
·带宽(bandwidth)	第24页
·传输延时	第24页
·不同交换方式对网络延时的影响	第24-26页
·网络阻塞对传输延时的影响	第26-27页
·机群互连网络的要求	第27-28页
·高性能	第27页
·可扩展	第27页
·高可用	第27页
·可移植	第27-28页
·对其他数据传输方式的支持	第28页
·本文主要贡献与创新	第28-30页
·本文的主要工作	第28-29页
·创新点	第29-30页
·论文的组织	第30-32页
第二章互连网络的研究现状	第32-44页
·互连网络交换机和路由器	第32-34页
·内部交换结构	第32-33页
·调度算法	第33-34页
·紧耦合系统互连网络	第34-38页
·CrayLink 网络	第34-36页
·Gigaplane-XB 网络	第36-37页
·紧耦合系统的延时和带宽性能	第37-38页
·机群互连网络	第38-43页
·Myrinet	第38-39页
·SCI	第39-40页
·Quadrics	第40-41页
·InfiniBand	第41-42页
·机群互连网络的带宽和延时性能	第42-43页
·互连网络研究现状小结	第43-44页
第三章通信对机群并行性能的影响	第44-62页
·并行计算的基本概念	第44-53页
·并行性能的衡量指标	第44-46页
(1) Amdahl 定律	第44-45页
(2) 使用Amdahl 定律的条件	第45页
(3) Amdahl 定律的局限	第45-46页
·并行计算模型	第46-48页
(1) PRAM 模型	第46-47页
(2) BSP 模型	第47页
(3) LogP 模型	第47-48页
·并行编程模型	第48-51页
(1) 数据并行	第48页
(2) 消息传递	第48-49页
(3) 共享存储	第49-51页
·机群与虚拟共享存储	第51-53页
(1) 机群	第51-52页
(2) 虚拟共享存储	第52页
(3) 机群上实现的虚拟共享存储	第52-53页
·通信对机群并行计算性能的影响	第53-61页
·测试环境	第53-55页
(1) MPI	第54页
(2) JIAJIA	第54-55页
·测试环境的底层通信性能	第55页
·减小通信时间，提高并行性能的方法	第55-61页
(1) 采用高速网络，减小消息延时和消息发送间隔	第56-58页
(2) 采用用户级通信协议，减小系统开销和协议开销	第58页
(3) 利用SMP 通信，减小消息延时，增大通信带宽	第58-59页
(4) 动态预取或迁移数据，改善数据局部性或使计算和通信更好地重叠	第59-60页
(5) 合并同时传送的消息，减少消息数量	第60-61页
·小结	第61-62页
第四章机群互连网络设计	第62-68页
·FRAMP 互连网络的要求	第62页
·数据交换方式	第62-63页
·流量控制和路由	第63-64页
·传输链路	第64页
·通信协议	第64-66页
·分组和帧格式	第66-67页
·小结	第67-68页
第五章机群交换机的设计和实现	第68-84页
·机群交换机的设计	第68-72页
·交换机的结构	第68-69页
·交换方式的选择	第69-70页
·缓冲的选择	第70页
(1) 电路交换方式下的“缓冲”	第70页
(2) 穿透交换方式下的缓冲	第70页
·交换机调度算法	第70-72页
·机群交换机的实现	第72-82页
·交换机的总体结构	第72-73页
·端口控制器	第73-75页
·交换和调度单元的FPGA 实现	第75-82页
(1) 电路交换方式的实现	第75-76页
(2) 穿透交换方式的实现	第76-77页
(3) 输入纯FIFO 缓冲	第77-78页
(4) 交换机的调度算法	第78-80页
(5) 交换机的流量控制	第80-81页
(6) 交换机延时	第81-82页
·FRAMP 交换机设计和实现小结	第82-84页
第六章 FRAMP 网络接口的设计和实现	第84-94页
·FRAMP 数据传输机制	第84-85页
·FRAMP 网络接口的总体设计	第85页
·PCI 接口控制器	第85-86页
·FIFO 缓冲器	第86-87页
·收发驱动和链路信号	第87-88页
·FRAMP 网卡上的FPGA	第88-92页
·总线仲裁	第89-90页
·消息发送和接收过程	第90页
·RDMA 写传输过程	第90-91页
·RDMA 读传输过程	第91页
·TLB 查找和更新逻辑	第91-92页
·小结	第92-94页
第七章 FRAMP 互连网络的测试和评价	第94-116页
·FRAMP 互连网络的测试和评价	第94-106页
·FRAMP 互连网络的非量化指标评价	第94-95页
·FRAMP 交换机的性能	第95-96页
(1) 端口带宽	第95页
(2) 交换延时	第95-96页
·FRAMP 网络接口到网络接口的数据传输延时	第96-97页
·FRAMP 底层硬件性能	第97-102页
(1) 小消息延时	第97-99页
(2) 大消息带宽	第99-101页
(3) LogGP 模型的参数值	第101页
(4) RDMA 写和读的延迟	第101-102页
·FRAMP API 性能	第102-106页
(1) 主要API 函数的延时	第102-104页
(2) 主要API 函数的带宽	第104页
(3) 与国内外同类系统的比较	第104-106页
·用FRAMP 网络连接的虚拟共享存储机群系统的性能评测	第106-113页
·机群并行应用程序访存行为的虚拟层次结构	第107-110页
(1) 特殊情况下访存行为的虚拟层次结构的数学描述	第107-108页
(2) 访存行为虚拟层次结构的例子	第108-109页
(2) 访存行为虚拟层次结构数学表示的使用条件和扩展	第109-110页
·应用程序在FRAMP 网络上的并行性能	第110-113页
(1) 硬件和软件环境	第110页
(2) 测试程序介绍	第110-111页
(3) 应用程序的实测性能	第111-112页
(4) 应用程序在FRAMP 与百兆以太网上的性能比较	第112页
(5) FRAMP 网络与Myrinet 和SCI 的性能比较	第112-113页
·FRAMP 网络评测小结	第113-116页
第八章结论和进一步工作	第116-118页
·本文工作的总结	第116-117页
·未来的工作	第117-118页
参考文献	第118-127页
致谢	第127-128页
作者简历	第128页