【音视频原理】音频编解码原理 ③ ( 音频 比特率 / 码率 | 音频 帧 / 帧长 | 音频 帧 采样排列方式 - 交错模式 和 非交错模式 )





一、音频 比特率 / 码率



1、音频 比特率


" 音频 比特率 " 指的是 每秒 传输的 音频的 比特数 ;

单位是 bps , Bit Per Second ;

" 音频 比特率 " 是 衡量 音频 质量 的 标准 ;

原始 PCM 采样的音频 , 其 比特率 = 采样频率 * 采样位数 * 音频通道数 ;


2、音频 比特率 案例


如 : 采样频率为 44100 Hz , 采样位数是 16 位 ( 单个采样 2 字节 ) , 采样的通道数是 双声道立体声 , 则 该音频的比特率 为 :

44100 × 16 × 2 = 1 , 411 , 200 44100 \times 16 \times 2 = 1,411,200 44100×16×2=1,411,200

该音频一秒钟的比特数为 1411200 比特 ;

该数据量 为 1411200 ÷ 8 = 176400 1411200 \div 8 = 176400 1411200÷8=176400 字节 , 大约 172MB ;


3、音频 码率


音频 的 码率 指的是 压缩后的 音频数据 的 比特率 , 是 音频数据 在单位时间内的 传输速率 或 压缩率 , 表示 每秒钟 传输 或 存储 的音频数据量 , 通常以 kbps 千比特每秒 为单位 ;

音频 码率 决定了 音频文件 的 音质 和 文件大小 之间的平衡 ;

没有压缩的音频的比特率是确定的 , 就是 " 未压缩比特率 = 采样频率 * 采样位数 * 音频通道数 " ;


4、音频 码率相关因素


音频码率的大小 相关的 因素 :

  • 音频的大小 :
    • 采样率
    • 位深度
    • 声道数
  • 编码算法

通常情况下 ,

  • 较高的码率 通常会提供更好的音质 , 因为它包含更多的音频数据 , 能够更准确地还原原始声音信号 , 但会占用更多的存储空间 ;
  • 较低的码率 可以减小文件大小 , 节省存储空间 , 但可能会导致音质的损失 , 因为它包含较少的音频数据 , 可能无法完全还原原始声音信号 ;

5、常见的 音频 码率


常见的 音频 码率 有 :

  • 96 kbps : FM 音质 , 适用于一些对音质要求不高的场景 ;
  • 128-160 kbps : 普通质量的音频码率 , 常用于在线音乐流媒体服务和普通音乐下载 ; 该 码率 音质较好 , 能够提供清晰的声音 , 在 复杂的音频场景 中可能会出现一些细节丢失 ;
  • 192 kbps : CD 音质 , 该码率提供更高的音质 , 适用于对音质要求较高的音乐和音频内容 , 它在保持相对较小的文件大小的同时 , 提供更多的音频细节和动态范围 ;
  • 256-320 kbps : 高质量音频的码率范围 , 通常被视为 无损音质 ; 该 码率 的 音频文件 能够提供非常接近原始录音的音质 , 适用于需要保留尽可能多音频细节的场景 ;

6、视频码率 - 仅做参考


视频码率 指的是 视频文件 在 单位时间内 的 数据流量 , 单位一般是 Mbps , 这是数据传输速率的一种单位 ;

Mbps 表示单位时间内传送比特的数目 , 通常用于衡量数字信号的传输速率 , 如 : 视频 / 音频 等多媒体数据的传输速率 , 网络带宽速率 等 ;


一般情况下 , 码率越高 , 视频的 分辨率 越高 , 视频越清晰 ; 但不是绝对的 , 有些时候 模糊的文件 码率也很高 ;


码率的单位 是 " Mbps " , 英文全称 " Megabits Per Second " , " 兆比特每秒 " , 是 传输速率单位 , 指每秒传输 比特 数量 ;

1 Mbps 代表每秒传输 1,000,000 位 ( 比特 , bit ) , 8 bit = 1 Byte , Byte 是字节 , 每字节 有 8 位 , 即 每秒传输的数据量为 1,000,000 / 8 =125,000 Byte / s ;





二、音频 帧 / 帧长



1、音频帧


" 音频帧 " 概念 : 将 音频 送入 音频编码器 进行编码时 , 一次性要送入指定个数的 " 采样 " ,

  • 这些指定个数又 称为 " 单元数 " ,
  • 这些指定个数的采样 称为为一个 " 编码单元 " , 又叫做 " 音频帧 "
  • 这些指定个数的采样 换一种说法 , 也可以理解为 " 指定时间内的采样数 " ;

音频帧 的概念 与 编码格式 紧密相关 , 并由各个 编码标准 自己实现 , 不同的 " 编码格式 " 的 编码帧 采样个数是不同的 ;

  • mp3 编码格式 的 音频编码帧 有 1152 个采样点 ;
  • aac 编码格式 的 音频编码帧 有 1024 个采样点 ;

2、音频 帧长度


音频 帧长度 指的是 每个 音频帧 的 " 播放持续时间 " ,

音频帧持续时间 ( 单位 : 秒 ) = 采样点数 ( 单位 : 个 ) / 采样频率 ( 单位 : 赫兹 Hz ) ;


音频 帧长度 也可以 指 " 压缩后每个 音频帧 的 数据长度 " ;


以 mp3 压缩格式为例 , 采样率是 48000Hz , 一个 音频帧 ( 编码单元 ) 有 1152 个采样点 , 则 " 音频帧长度 " 为 :

1152 ÷ 48000 = 0.024 秒 = 24 毫秒 1152 \div 48000 = 0.024 秒 = 24 毫秒 1152÷48000=0.024=24毫秒


上面提到的 " 采样点数 " 概念 , 注意区分 采样点数 与 采样个数 :

  • 如果是 单声道 , 就有 1 个音频采样 ,
  • 如果是 立体声 ( 双声道 ) , 就有 2 个音频采样 ,
  • 如果是 环绕声 ( 四声道 ) , 就有 4 个音频采样 ;




三、音频 帧 采样排列方式 - 交错模式 和 非交错模式



音频 编码 或 解码 时 , 首先要知道 在 音频帧 中 采样点 的排列方式 ,

数据以 " 连续帧 " 的方式存放 , 先记录 帧 1 的采样点 , 再记录 帧 2 的采样点 ,

在 " 音频帧 内部 " 的 音频 采样 排列方式 主要有 交错模式非交错模式 两种排列方式 ;


1、交错模式


交错模式 : 在 存储 音频采样时 , 下图是 记录 4 个 双通道 采样点数据 ,

  • 首先 , 记录 采样点 1 的 左声道 和 右声道 ,
  • 然后 , 记录 采样点 2 的 左声道 和 右声道 ,
  • 再后 , 记录 采样点 3 的 左声道 和 右声道 ,
  • 最后 , 记录 采样点 4 的 左声道 和 右声道 ,

在这里插入图片描述


2、非交错模式


非交错模式 : 在 音频帧 中 存储 音频采样时 , 下图是 记录 4 个 双通道 采样点数据 ,

  • 首先 , 记录 采样点 1 ~ 采样点 4 的 左声道 样本 ,
  • 然后 , 记录 采样点 1 ~ 采样点 4 的 右声道 样本 ;

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/han1202012/article/details/135852745