vod指的是什么模电 vod指的是什么( 五 )


举例来说 , 大约 20% 的视频消费发生在无法播放 VP9 编码视频的设备上 。所以 , 如果一个视频的预测观看时间是 100 小时 , 那么使用广泛应用的 H264 编***的有效预测观看时间是 100 小时 , 而 VP9 编码的有效预测观看时间是 80 小时 。
编码族中缺失编码的归一化计算成本:这是我们为使编码族可交付所需的逻辑计算周期量 。在交付视频之前 , 编码族需要提供一组最低的分辨率 。举例来说 , VP9 族至少需要 4 种分辨率才能编码特定的视频 。但一些编码需要比另一些编码更长的时间 , 这意味着不是所有的视频分辨率都可以同时提供 。
举个例子 , 假设视频 A 缺少 VP9 族中的所有 4 个通道 。通过总结所有 4 个通道的估计 CPU 使用量 , 我们可以为四个任务分配相同的归一化成本 。
如视频 B 所示 , 如果我们在 4 个通道中只有 2 条缺失 , 那么计算成本就是产生其余两个编码的总和 。同样的成本适用于两个任务 。因为优先级是效益除以成本 , 所以当更多通道可用时 , 任务的优先级就变得更加急迫 。编码通道直到可交付时才有价值 , 所以尽快得到完整的通道非常重要 。比如说 , 拥有包含所有 VP9 通道的视频要比拥有 10 个不完整(因此无法交付)VP9 通道的视频更有价值 。
通过机器学习预测观看时间一种新的效益 - 成本模型告诉我们应该如何对某些视频进行编码 , 下一个难题是如何确定哪些视频应该优先编码 。因此 , 我们现在使用机器学习来预测哪些视频将被观看的次数最多 , 从而应该优先考虑使用高级编码 。
这个模型将考虑一些因素来预测视频在接下来的一小时里的观看时间 。它通过查看视频上传者的好友或粉丝的数量和他们之前上传的视频的平均观看时间 , 以及视频本身的元数据 , 包括视频的长度、宽度、高度、隐私状态、帖子类型(直播、故事、观看等等)、视频的发布日期、视频过去在平台上的受欢迎程度 , 来实现这一目的 。
但当将所有这些数据都用于决策时 , 会遇到一些内在的挑战:
观看时间具有高度的差异性 , 而且长尾效应非常显著 。即便我们集中精力预测下一个小时的观看时间 , 一段视频的观看时间也可能从零到 5 万小时以上 , 这取决于视频的内容、上传者和视频的隐私设置 。这个模型不仅需要能够判断视频是否会受欢迎 , 而且需要能够判断其受欢迎程度 。
下一个小时的观看时间最好的指标是它之前的观看时间轨迹 。一般而言 , 视频的受欢迎程度很不稳定 。同一内容创作者上传的不同视频 , 有时会因为社区对该内容的反应而导致不同的观看时间 。通过对不同特征的实验 , 我们发现 , 过去的观看时间轨迹是未来观看时间的最佳预测指标 。在设计模型结构和平衡训练数据方面 , 这将带来两项技术挑战:
新上传的视频没有观看时间轨迹 。一段视频在 Facebook 上停留得越久 , 我们就能从它过去的观看时间中获得更多信息 。也就是说 , 最能预测的特征将不适用于新视频 。在数据缺失的情况下 , 我们希望我们的模型也能很好地发挥作用 , 因为系统越早确定将在平台上流行的视频 , 就越有可能提供更高质量的内容 。热播视频有控制训练数据的趋势 。最受欢迎的视频模式未必适合所有的视频 。观看时间的性质因视频类型的不同而不同 。故事视频较短 , 平均观看时间比其他视频短 。在流媒体播放过程中或之后的几个小时里 , 直播流可以获得大部分观看时间 。同时 , 点播视频(VOD)的寿命也是多种多样的 , 如果人们后来开始分享这些视频 , 那么在最初上传之后很长一段时间就可以积累观看时间 。
机器学习指标的提高未必与产品改进直接相关 。RMSE、MAPE 和 Huber Loss 等传统的回归损失函数对离线模型的优化效果良好 。但是 , 建模误差的降低并不一定会直接导致产品的改进 , 例如改善用户体验、增加观测时间的覆盖率或者提高计算效率 。
构建视频编码的机器学习模型为应对这些挑战 , 我们决定通过使用观看时间事件数据堆模型进行训练 。在训练 / 评估中的每一行都表示一个决策点 , 表示系统必须对它进行预测 。