[转载] Google数据中心网络技术漫谈

1.前言
作为世界上最强大的互联网服务提供商之一 , 一直在推动着业界技术的发展 , 最知名的当属其在分布式计算领域的领先成果和领导地位 。而随着的网络技术领域的领导人Amin 在2015年6月召开的Open(ONS , 开放网络峰会)上首次发布了网络技术的演进路径并重点对其数据中心网络技术进行阐述 , 在网络领域的技术创新才被揭开了神秘的面纱 , 并迅速在业界引起极大的反响 。
本文以Amin的演讲内容为主要素材来源 , 并添加了作者对相关内容的理解和说明 , 希望能够帮助读者对Amin讲授的网络技术有更深入的认识 。
【[转载] Google数据中心网络技术漫谈】2.网络技术演进路线
的网络技术进展 , 特别是其在SDN( , 软件定义网络)领域的实践 , 一直以来都是业界关注的重点 , 最典型的就是其于2013年解密的B4网络被视作迄今最成功的SDN案例 。而Amin在ONS 2015峰会上描绘的网络技术的演进路径(如图1所示) , 无疑为业界提供了探知网络技术发展脉络的重要线索 。
图1 网络技术演进路线
如图1所示 , 在过去的近十年间 , 建立的网络技术体系不但全面覆盖了众多的网络业务场景 , 并且还在随着业务的开展持续优化 。与图1所示的各项网络技术相对应的网络业务场景如表1所示 。
表1 网络创新技术的运用场景
如表1所示 , 的网络技术体系在当前已经非常完备 。其中 , 既有其用于广域网互连的B4、 , 又有其用于园区网互连的及其用于数据中心内部互连的、 , 还有其在网络业务层面的创新研发 , 例如QUIC、gRPC 。
在上述的各项技术中 , gRPC技术已经通过开源的方式全面公开 , Onix、B4也有相关的学术论文揭示其核心原理 , 则由Amin在去年的ONS峰会上做过介绍 , 其余的技术 , 诸如等 , 则仍然保持着神秘 。在本次ONS峰会上 , Amin为业界展示了数据中心网络的核心技术 , 并将它视作支撑云平台的重要基础 。
3.数据中心网络技术概述
众所周知 , 计算、存储、网络是构成数据中心的三大要素 。而在此前的技术进展中 , 计算和存储已经遭遇瓶颈 , 主要体现在:计算方面 , 随着半导体技术面临的物理障碍不可逾越 , 摩尔定律失效的时限日益临近 , 因此单个计算节点的性能提升有限 , 从而必须依赖于分布式计算技术 , 而分布式集群中节点间的网络将成为影响集群工作效率的关键;存储方面 , 支持管理机制和存储空间分离的分布式存储技术已经解决了存储容量的问题 , 但是存储I/O仍是瓶颈(高性能的Flash当前仍旧停留在缓存的范畴) , 因此存储性能的改进也非常依赖于网络能力的增强 。因此 , 网络已经成为了提升大规模数据中心运行性能的关键点 , 是维持数据中心资源效率平衡的关键 。
与其它的网络环境相比较 , 数据中心网络拥有的特征如图2所示 。在这些特征中 , 最关键的一点在于数据中心的建设和管理都可以由同一个组织完成并具有单独的管理域 , 使得数据中心的网络边界相对清晰 , 并且其对外部网络的影响可控 , 这也是业界普遍将数据中心作为SDN引入首选场景的重要原因之一 。另外 , 数据中心网络的带宽普遍有保障 , 而对延迟的要求更高 , 特别是数据中心中大量运行着分布式计算平台 , 这种场景下对tail 的要求更加严格 , 即计算过程中由响应最慢节点返回结果时产生的延迟 , 这块“短木板”将是影响整个分布式系统计算性能的关键 。