超视频时代音视频架构建设与演进( 三 )


可以看到 , 基础设施层主要包括硬件、配套云服务、云原生中间件以及各类开源基础软件 。而在工作负载层面 , 是大量的软件工作 , 包括核心的框架、SDK 以及开源软件贡献() 。这也是为什么英特尔以硬件闻名 , 却维持着超过一万人的软件研发团队 。
拆解软硬一体的音视频架构方案
基础设施层
在基础设施层 , 我们的首要关注对象就是硬件 , 尤其是对于音视频服务来说 , 硬件提升对业务带来的增益相当直接 。
但相比于十年前 , 当前的硬件产品家族的复杂度和丰富度都直线上升 , 其核心原因无外乎多变的场景带来了新的计算需求 , 靠 CPU 吃遍天下的日子已经一去不复返了 。以前面展示的英特尔硬件矩阵为例 , 在音视频场景下 , 我们主要关注 CPU、GPU、IPU , 受限于文章篇幅 , 网卡一类的其他硬件不在重点讨论范围内 。
在 CPU 方面 , 英特尔已更新至强? 第三代可扩展处理器 , 相比第二代内存带宽提升 1.60 倍 , 内存容量提升 2.66 倍 , 采用 PCIe Gen 4 , PCI通道数量至多增加 1.33 倍 。其中 , 英特尔? 至强?8380 处理器可以达到 8 通道、 40 个内核 , 主频 2.30 GHz , 英特尔支持冬奥会转播 8k 转播时 , CPU 侧的主要方案即是8380 。这里贴一张详细参数列表供你参考():
英特尔 CPU 另外一个值得关注的特点 , 在于其配套软件层面 , 主要是 AVX-512 指令集 。AVX-512 指令集发布于 2013 年 , 属于扩展指令集 。老的指令集只支持一条指令操作一个数据 , 但随着场景需求的变化 , 单指令多数据操作成为必选项 , AVX 系列逐渐成为主流 。目前 , AVX-512 指令集的主要使用意义在于使程序可同时执行 32 次双精度、64 次单精度浮点运算 , 或操作八个 64 位和十六个 32 位整数 。理论上可以使浮点性能翻倍 , 整数计算性能增加约 33% , 且目前只在 、 Ice Lake 等三代 CPU 上提供支持 , 因此也较为独特 。
在视频编解码、 转码等流程中 , 因为应用程序需要执行大规模的整型和浮点计算 , 所以对 AVX-512 指令集的使用也相当关键 。
而 GPU 方案在云游戏场景中 , 通常更加引人瞩目 , 英特尔? 服务器 GPU 是基于英特尔 Xe 架构的数据中心的第一款独立显卡处理单元 。英特尔? 服务器 GPU 基于 23W 独立片上系统(SoC)设计 , 有 96 个独立执行单元、128 位宽流水线、8G 低功耗内存 。
所谓片上系统 SoC , 英文全称是on Chip , 也就是系统级芯片 , SoC 包括但不仅限于 CPU、GPU 。就在今年 , 前 Mac 系统架构团队负责人、苹果 M1 芯片的“功臣” Jeff宣布离开苹果 , 担任英特尔院士(Intel )、设计工程事业群(Group)CTO , 并负责客户端 SoC 架构设计 , 也在行业内引起了众多关注 。
当然 , 只有 GPU 硬件本身是不够的 , 英特尔? Media SDK 几乎是搭配 GPU 的必选项 。英特尔? Media SDK 提供的是高性能软件开发工具、库和基础设施 , 以便基于英特尔? 架构的硬件基础设施上创建、开发、调试、测试和部署企业级媒体解决方案 。
其构成可参考下图:
IPU 是为了分担 CPU 工作负载而诞生的专用芯片 , 2021 年 6 月 , 英特尔数据平台事业部首席技术官 Guido表示:“IPU 是一种全新的技术类别 , 是英特尔云战略的重要支柱之一 。它扩展了我们的智能网卡功能 , 旨在应对当下复杂的数据中心 , 并提升效率 。”