首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--机房论文

数据中心RDMA网络资源复用与应用加速研究

摘要第4-6页
Abstract第6-7页
第一章 绪论第15-25页
    1.1 研究背景与主要问题第15-16页
    1.2 研究现状第16-19页
    1.3 技术难点与解决方案第19-21页
    1.4 本文工作第21-23页
        1.4.1 实现公平有效的RDMA资源复用第22页
        1.4.2 利用RDMA加速分布式机器学习框架MXNet第22-23页
    1.5 本文组织第23-25页
第二章 背景介绍及相关工作第25-39页
    2.1 RDMA的工作原理第25-32页
        2.1.1 RDMA网络协议栈与IO模型第25-27页
        2.1.2 RDMA网络缓冲区访问方式第27-28页
        2.1.3 RDMA网络资源管理与通信原语第28-29页
        2.1.4 RDMA主机端IO路径与网卡处理单元第29-30页
        2.1.5 RoCE网络的流量控制与拥塞控制第30-32页
    2.2 分布式机器学习中的参数服务器第32-34页
    2.3 资源复用第34-36页
        2.3.1 基于面向无连接加协程的资源复用方法第34页
        2.3.2 基于面向连接加互斥锁的资源复用方法第34-35页
        2.3.3 基于动态连接的资源复用方法第35-36页
    2.4 利用RDMA加速数据中心应用第36-39页
        2.4.1 RDMA加速键值存储第36页
        2.4.2 RDMA加速远程过程调用第36-37页
        2.4.3 RDMA加速分布式事务第37-39页
第三章 实现公平有效的RDMA资源复用第39-55页
    3.1 问题描述与动机第39-43页
    3.2 挑战第43-44页
    3.3 Avatar的设计与架构第44-45页
    3.4 异步请求响应和处理第45页
    3.5 公平传输服务第45-46页
    3.6 流量接收与分发第46页
    3.7 线程工作模式第46-47页
    3.8 实验结果第47-53页
        3.8.1 资源共享下的性能测试第47-49页
        3.8.2 公平传输服务测试第49-52页
        3.8.3 延迟和CPU利用率第52-53页
    3.9 小结第53-55页
第四章 利用RDMA加速分布式机器学习框架MXNet第55-77页
    4.1 问题描述与动机第55-57页
        4.1.1 分布式机器学习第55-56页
        4.1.2 RDMA第56-57页
    4.2 挑战第57页
    4.3 SpaceX的设计与架构第57-58页
    4.4 接口设计第58-59页
    4.5 连接参数调优第59-62页
    4.6 数据对齐到缓存行加速网络IO第62-64页
    4.7 网络缓冲区自管理和内存访问模式自适应第64-71页
        4.7.1 降低小数据传输的开销和自动管理网络缓冲区第65-68页
        4.7.2 消除大数据传输的内存注册开销和零拷贝接口设计第68-71页
    4.8 通信模式和语义适配第71页
    4.9 实验结果第71-75页
        4.9.1 Ps-lite加速测试第72-74页
        4.9.2 MXNet加速测试第74-75页
    4.10 小结第75-77页
第五章 总结与展望第77-79页
    5.1 工作总结第77页
    5.2 研究展望第77-79页
        5.2.1 超高速数据中心网络的软硬件协同第77-78页
        5.2.2 数据中心虚拟化环境下RDMA网络服务隔离第78-79页
致谢第79-81页
参考文献第81-86页
简历与科研成果第86-87页

论文共87页,点击 下载论文
上一篇:基于LTE的无源人体动作识别的研究
下一篇:共享经济下的政府监管研究--以政府对网约车的监管为例