流媒体播放的数学原理

这是本系列的第六篇文章
前五篇文章的链接如下:
自适应流媒体传输（一）——DASH媒体内容的生成
 自适应流媒体传输（二）——为什么要使用fragmented MP4
自适应流媒体传输（三）——和TS格式说再见
 自适应流媒体传输（四）——深入理解MPD
自适应流媒体传输（五）——正确认识码率切换

当我们抛开繁杂的业务代码，从纯数学的角度去理解流媒体传输\播放的过程，会有全新的体会。

首先，无论是传统的渐进式下载（progressive download）还是现在流行的自适应传输（adaptive streaming），我们认为二者都是基于块（chunk）的下载模式。

渐进式下载

在传统的渐进式下载场景中，我们可以将总体思路提炼为：客户端以chunk为单位下载某一固定的媒体文件。如下图所示，图中的红点代表每一次针对chunk的http get请求

在这里插入图片描述

在这个过程中，我们可以提炼出以下几个变量

可用带宽 bandwidth
当前可用带宽是一个动态变化的随机变量，在[lo,hi]（lo和hi代表最小和最大带宽）之间符合高斯分布，也可简化为均匀分布。
初始缓冲量start_cnt
缓冲区长度达到该值即可开始播放，比如可以假设初始缓冲区内有4个chunk时开始播放
缓冲区上限值max_buf_sz
假设缓冲区上限值为10s，当缓冲区长度达到此上限时暂停下载后续chunk；当缓冲区下溢时即进入重缓冲状态，此时下载chunk至可以再次播放
当前缓冲区长度cur_buf_sz
块长度chunk_len
一个chunk对应的视频时长
三种状态
Buffering & Steady & Wait

三种状态之间的转换关系如下图，图中同时说明了上述变量在状态转换过程中是如何变化的：
在这里插入图片描述
理解了上面的数学关系后，我们可以对渐进式流媒体传输的过程进行仿真。

假设视频源码率为10Mbps，可用带宽在9-11Mbps之间呈均匀分布，此时我们可以得出如下图的仿真结果。图中红色虚线代表可用带宽，蓝色点线代表当前缓冲区长度，黑色竖线代表发生了重缓冲事件。
在这里插入图片描述
扩大可用带宽的波动范围至5-13Mbps，此时的仿真结果如下图，重缓冲事件的发生频率明显增加

自适应流媒体传输

在渐进式下载的基础上，自适应流媒体传输场景中有以下新增变量

多级码率
预测带宽predict_bw
由前面chunk的下载速度预测接下来的可用带宽，有多种预测方法，包括取平均、加权求和等
缓冲区阈值buf_threshold
一般会设置一些缓冲区阈值，当低于对应的阈值时做出相应的反应
例如，当cur_buf_sz<=chunk_len时，立即切换为最低码率的chunk
例如，当cur_buf_sz<=max_buf_sz / 2时，切换为低一级码率的chunk

下面分别展示两种自适应策略下的流媒体状态转换图，为了便于理解，这里的两种策略都很粗暴，现实中不会有这么粗暴的策略。