首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--机房论文

基于可编程网卡的高性能数据中心系统

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第13-22页
    1.1 研究的背景和意义第13-15页
    1.2 国内外研究现状第15-20页
        1.2.1 优化软件第15-16页
        1.2.2 利用新型商用硬件第16-18页
        1.2.3 设计新硬件第18-20页
    1.3 本文的研究内容和贡献第20-21页
    1.4 论文结构安排第21-22页
第2章 数据中心与可编程网卡概论第22-58页
    2.1 数据中心的发展趋势第22-32页
        2.1.1 资源虚拟化第23-24页
        2.1.2 分布式计算第24-28页
        2.1.3 定制化硬件第28-31页
        2.1.4 细粒度计算第31-32页
    2.2 “数据中心税”第32-37页
        2.2.1 虚拟网络第32-34页
        2.2.2 网络功能第34-36页
        2.2.3 操作系统第36-37页
        2.2.4 数据结构处理第37页
    2.3 可编程网卡的架构第37-50页
        2.3.1 专用芯片(ASIC)第38-39页
        2.3.2 网络处理器(NP)第39-42页
        2.3.3 通用处理器(SoC)第42-44页
        2.3.4 可重构硬件(FPGA)第44-50页
    2.4 可编程网卡在数据中心的应用第50-58页
        2.4.1 微软Azure云第50-53页
        2.4.2 亚马逊AWS云第53-56页
        2.4.3 阿里云、腾讯云、华为云、百度第56-58页
第3章 系统架构第58-65页
    3.1 网络加速第59-61页
        3.1.1 网络虚拟化加速第59-60页
        3.1.2 网络功能加速第60-61页
    3.2 存储加速第61-62页
        3.2.1 存储虚拟化加速第61页
        3.2.2 数据结构处理加速第61-62页
    3.3 操作系统加速第62-63页
    3.4 可编程网卡第63-65页
第4章 ClickNP网络功能加速第65-97页
    4.1 引言第65-67页
    4.2 背景第67-71页
        4.2.1 软件虚拟网络与网络功能的性能挑战第67-68页
        4.2.2 基于FPGA的网络功能编程第68-71页
    4.3 系统架构第71-75页
        4.3.1 ClickNP开发工具链第71页
        4.3.2 ClickNP编程第71-75页
    4.4 FPGA内部并行化第75-79页
        4.4.1 元件间并行化第75页
        4.4.2 元件内并行第75-79页
    4.5 系统实现第79-86页
        4.5.1 ClickNP工具链和硬件实现第79-81页
        4.5.2 ClickNP元件库第81-84页
        4.5.3 PCIE I/O通道第84-86页
        4.5.4 Verilog元件第86页
    4.6 应用与性能评估第86-95页
        4.6.1 数据包生成器和抓包工具第87页
        4.6.2 OpenFlow防火墙第87-89页
        4.6.3 IPSec网关第89-91页
        4.6.4 L4负载平衡器第91-93页
        4.6.5 pFabric流调度器第93-95页
    4.7 讨论: 资源利用率第95-96页
    4.8 本章小结第96-97页
第5章 KV-Direct数据结构加速第97-132页
    5.1 引言第97-98页
    5.2 背景第98-104页
        5.2.1 键值存储的概念第98-99页
        5.2.2 键值存储的工作负载变化第99-100页
        5.2.3 现有键值存储系统的性能瓶颈第100-102页
        5.2.4 远程直接键值访问面临的挑战第102-104页
    5.3 KV-Direct操作原语第104-105页
    5.4 键值处理器第105-117页
        5.4.1 哈希表第106-110页
        5.4.2 Slab内存分配器第110-111页
        5.4.3 乱序执行引擎第111-114页
        5.4.4 DRAM负载分配器第114-115页
        5.4.5 向量操作译码器第115-117页
    5.5 系统性能评估第117-121页
        5.5.1 系统实现第117页
        5.5.2 测试床与评估方法第117页
        5.5.3 吞吐量第117-118页
        5.5.4 能耗效率第118-120页
        5.5.5 延迟第120页
        5.5.6 对CPU性能的影响第120-121页
    5.6 扩展第121-127页
        5.6.1 基于CPU的分散.聚集DMA第121-122页
        5.6.2 单机多网卡第122-123页
        5.6.3 基于SSD的持久化存储第123-125页
        5.6.4 分布式键值存储第125-127页
    5.7 讨论第127-129页
        5.7.1 不同容量的网卡硬件第127-128页
        5.7.2 对现实世界应用的影响第128页
        5.7.3 可编程网卡内的有状态处理第128-129页
    5.8 相关工作第129-131页
    5.9 本章小结第131-132页
第6章 SocksDirect通信原语加速第132-169页
    6.1 引言第132-134页
    6.2 背景第134-143页
        6.2.1 Linux套接字简介第134-135页
        6.2.2 Linux套接字中的开销第135-140页
        6.2.3 高性能套接字系统第140-143页
    6.3 架构概览第143-146页
    6.4 系统设计第146-157页
        6.4.1 无锁套接字共享第146-149页
        6.4.2 基于RDMA和共享内存的环形缓冲区第149-151页
        6.4.3 零拷贝第151-153页
        6.4.4 事件通知第153-154页
        6.4.5 连接管理第154-157页
    6.5 系统性能评估第157-161页
        6.5.1 评估方法第157-158页
        6.5.2 性能微基准测试第158-160页
        6.5.3 实际应用性能第160-161页
    6.6 讨论: 连接数可扩放性第161-168页
        6.6.1 基于可编程网卡的传输层第162-164页
        6.6.2 基于CPU的传输层第164-165页
        6.6.3 多套接字共享队列第165-167页
        6.6.4 应用、协议栈与网卡间的接口抽象第167-168页
    6.7 本章小结第168-169页
第7章 总结与展望第169-184页
    7.1 全文总结第169-170页
    7.2 未来工作展望第170-184页
        7.2.1 基于片上系统的可编程网卡第170-171页
        7.2.2 开发工具链第171-175页
        7.2.3 操作系统第175-179页
        7.2.4 系统创新第179-184页
参考文献第184-204页
致谢第204-207页
在读期间发表的学术论文与取得的研究成果第207-208页

论文共208页,点击 下载论文
上一篇:密集恒星背景下暗弱目标提取技术研究
下一篇:背景音乐对单列行人流影响的实验研究