【音视频原理】音频编解码原理 ③ ( 音频比特率 / 码率 | 音频帧 / 帧长 | 音频帧采样排列方式 - 交错模式和非交错模式 )

文章目录

一、音频比特率 / 码率
二、音频帧 / 帧长
- 1、音频帧
- 2、音频帧长度
三、音频帧采样排列方式 - 交错模式和非交错模式
- 1、交错模式
- 2、非交错模式

一、音频比特率 / 码率

1、音频比特率

" 音频比特率 " 指的是每秒传输的音频的比特数 ;

单位是 bps , Bit Per Second ;

" 音频比特率 " 是衡量音频质量的标准 ;

原始 PCM 采样的音频 , 其比特率 = 采样频率 * 采样位数 * 音频通道数 ;

2、音频比特率案例

如 : 采样频率为 44100 Hz , 采样位数是 16 位 ( 单个采样 2 字节 ) , 采样的通道数是双声道立体声 , 则该音频的比特率为 :

$44100 \times 16 \times 2 = 1,411,200$

该音频一秒钟的比特数为 1411200 比特 ;

该数据量为 $1411200 \div 8 = 176400$ 字节 , 大约 172MB ;

3、音频码率

音频的码率指的是压缩后的音频数据的比特率 , 是音频数据在单位时间内的传输速率或压缩率 , 表示每秒钟传输或存储的音频数据量 , 通常以 kbps 千比特每秒为单位 ;

音频码率决定了音频文件的音质和文件大小之间的平衡 ;

没有压缩的音频的比特率是确定的 , 就是 " 未压缩比特率 = 采样频率 * 采样位数 * 音频通道数 " ;

4、音频码率相关因素

音频码率的大小相关的因素 :

音频的大小 :
- 采样率
- 位深度
- 声道数
编码算法

通常情况下 ,

较高的码率通常会提供更好的音质 , 因为它包含更多的音频数据 , 能够更准确地还原原始声音信号 , 但会占用更多的存储空间 ;
较低的码率可以减小文件大小 , 节省存储空间 , 但可能会导致音质的损失 , 因为它包含较少的音频数据 , 可能无法完全还原原始声音信号 ;

5、常见的音频码率

常见的音频码率有 :

96 kbps : FM 音质 , 适用于一些对音质要求不高的场景 ;
128-160 kbps : 普通质量的音频码率 , 常用于在线音乐流媒体服务和普通音乐下载 ; 该码率音质较好 , 能够提供清晰的声音 , 在复杂的音频场景中可能会出现一些细节丢失 ;
192 kbps : CD 音质 , 该码率提供更高的音质 , 适用于对音质要求较高的音乐和音频内容 , 它在保持相对较小的文件大小的同时 , 提供更多的音频细节和动态范围 ;
256-320 kbps : 高质量音频的码率范围 , 通常被视为无损音质 ; 该码率的音频文件能够提供非常接近原始录音的音质 , 适用于需要保留尽可能多音频细节的场景 ;

6、视频码率 - 仅做参考

视频码率指的是视频文件在单位时间内的数据流量 , 单位一般是 Mbps , 这是数据传输速率的一种单位 ;

Mbps 表示单位时间内传送比特的数目 , 通常用于衡量数字信号的传输速率 , 如 : 视频 / 音频等多媒体数据的传输速率 , 网络带宽速率等 ;

一般情况下 , 码率越高 , 视频的分辨率越高 , 视频越清晰 ; 但不是绝对的 , 有些时候模糊的文件码率也很高 ;

码率的单位是 " Mbps " , 英文全称 " Megabits Per Second " , " 兆比特每秒 " , 是传输速率单位 , 指每秒传输比特数量 ;

1 Mbps 代表每秒传输 1,000,000 位 ( 比特 , bit ) , 8 bit = 1 Byte , Byte 是字节 , 每字节有 8 位 , 即每秒传输的数据量为 1,000,000 / 8 =125,000 Byte / s ;

二、音频帧 / 帧长

1、音频帧

" 音频帧 " 概念 : 将音频送入音频编码器进行编码时 , 一次性要送入指定个数的 " 采样 " ,

这些指定个数又称为 " 单元数 " ,
这些指定个数的采样称为为一个 " 编码单元 " , 又叫做 " 音频帧 "
这些指定个数的采样换一种说法 , 也可以理解为 " 指定时间内的采样数 " ;

音频帧的概念与编码格式紧密相关 , 并由各个编码标准自己实现 , 不同的 " 编码格式 " 的编码帧采样个数是不同的 ;

mp3 编码格式的音频编码帧有 1152 个采样点 ;
aac 编码格式的音频编码帧有 1024 个采样点 ;

2、音频帧长度

音频帧长度指的是每个音频帧的 " 播放持续时间 " ,

音频帧持续时间 ( 单位 : 秒 ) = 采样点数 ( 单位 : 个 ) / 采样频率 ( 单位 : 赫兹 Hz ) ;

音频帧长度也可以指 " 压缩后每个音频帧的数据长度 " ;

以 mp3 压缩格式为例 , 采样率是 48000Hz , 一个音频帧 ( 编码单元 ) 有 1152 个采样点 , 则 " 音频帧长度 " 为 :

$1152 \div 48000 = 0.024 秒 = 24 毫秒$

上面提到的 " 采样点数 " 概念 , 注意区分采样点数与采样个数 :

如果是单声道 , 就有 1 个音频采样 ,
如果是立体声 ( 双声道 ) , 就有 2 个音频采样 ,
如果是环绕声 ( 四声道 ) , 就有 4 个音频采样 ;

三、音频帧采样排列方式 - 交错模式和非交错模式

音频编码或解码时 , 首先要知道在音频帧中采样点的排列方式 ,

数据以 " 连续帧 " 的方式存放 , 先记录帧 1 的采样点 , 再记录帧 2 的采样点 ,

在 " 音频帧内部 " 的音频采样排列方式主要有交错模式和非交错模式两种排列方式 ;

1、交错模式

交错模式 : 在存储音频采样时 , 下图是记录 4 个双通道采样点数据 ,

首先 , 记录采样点 1 的左声道和右声道 ,
然后 , 记录采样点 2 的左声道和右声道 ,
再后 , 记录采样点 3 的左声道和右声道 ,
最后 , 记录采样点 4 的左声道和右声道 ,

在这里插入图片描述

2、非交错模式

非交错模式 : 在音频帧中存储音频采样时 , 下图是记录 4 个双通道采样点数据 ,

首先 , 记录采样点 1 ~ 采样点 4 的左声道样本 ,
然后 , 记录采样点 1 ~ 采样点 4 的右声道样本 ;

在这里插入图片描述