【音视频原理】音频编解码原理 ② ( 采样值 - 本质分析 | 采样值 - 震动振幅值 | 采样值的录制与播放 | 采样值在播放设备中才有意义 | 音频采样率 | 音频采样精度

文章目录

一、采样值 - 本质分析
二、音频概念 - 采样率 / 采样精度 / 音频通道

一、采样值 - 本质分析

1、采样值 - 震动振幅值

物体发生震动 , 在空气中传播 , 被人耳接收产生我们理解中的声音 ;

物体震动 , 产生的振幅 , 就是声音的响度 , 振幅越大 , 响度越大 ;

如 :

声带震动 , 产生声音 ;
乐器震动 , 产生声音 ;

物体震动的振幅 , 就是声音的响度值 , 就是采样值 ;

假设采样位数是 8 位 , 可以表示 256 种响度值 , 取值范围是 -128 ~ 127 ;

2、采样值的录制与播放

使用录音设备 , 录制音频 , 某个时间戳时刻获取的采样值 100 , 此时 100 这个值 , 是一个数值 , 这个数值单独拿出来没有任何意义 ;

将这个数值 100 输出到音响中 , 此时音响的输出设置的采样位数也是 8 位 , 将 100 放到音响中 , 就可以还原录制视频时的震动振幅 , 发出对应时间戳时刻的声音 ;

3、采样值与声音的分贝值无关

100 这个值与真实的音量响度 , 也就是分贝值 , 没有关系 , 播放的声音大小只与录音设备参数有关 ;

如 : 录制 50 分贝的声音 , 不同的录音设置录制的采样值是不同的 , 相同的录音设备使用不同的参数录制的采样值也是不同的 , 50 分贝的声音可以是 100 采样值 , 也可以是 50 采样值 ;

扫描二维码关注公众号，回复： 17376559 查看本文章

100 采样值在播放设备中播放的声音分贝数大小也是无关的 , 在手机中播放 100 采样值是 40 分贝 , 在大功率扬声器中播放 100 采样值可能就是 80 分贝 , 播放 100 采样值的分贝数与播放设备及参数有关 ;

4、采样值在播放设备中才有意义

这个 100 的采样值 , 拿在手里没有任何作用 , 也听不到声音 , 只有在播放环境中 , 在音响 / 扬声器设备中才有意义 ;

如果播放的设备的采样位数不是 8 位 , 而是 16 位 , 那么就需要将 100 这个值转为 16 位的采样值 ,

将 100 处于取值范围 -128 ~ 127 , 等比例放大到 -32768 ~ +32767 取值范围中 , 计算过程如下 :

$\cfrac{100}{128} \times 32768 =25600$

最后将重采样的 25600 采样值输入到 16 位采样位数的音响中 ;

二、音频概念 - 采样率 / 采样精度 / 音频通道

1、常用的音频采样率

常用的音频采样频率 :

22000 Hz : 常用于无线广播 ;
44100 Hz : 常用于 CD 音质 ;
48000 Hz : DVD 和数字电视音质 ;
96000 Hz : 蓝光和高清 DVD 音质 ;
192000 Hz : 蓝光和高清 DVD 音质 ;

人耳能听到的频率范围是 20Hz ~ 20000Hz , 那么根据 " 奈奎斯特 Nyguist 采样定理 " , 想要保证人耳听到的声音不失真 , 需要使用 40000Hz 以上的采样率 ;

人耳听到的超过 44100Hz 的采样频率的音频 , 与更高采样频率的音频 , 效果是一样的 ;

注意 : 使用高端音响设备发出的超过 44100Hz 的采样频率的声音与低端设备发出的声音 , 是不同的 , 因为谐振不同 ;

2、音频采样精度

音频采样精度 , 就是采样值的位数 , 常见的采样位数有 :

8 位采样精度 : 使用 1 字节数据表示单个音频采样 ; 这是早期的数字音频系统使用 8 位采样精度 , 每个采样点可以用 $2^8 = 256$ 个不同的值来表示 , 这种精度相对较低 , 产生的音频质量较为粗糙 , 有明显的量化噪声 ;
16 位采样精度 : 使用 2 字节数据表示单个音频采样 ; 这是最常见的采样精度 , 该采样精度提供了 $2^{16} = 65536$ 不同的值来表示每个采样点 , 该精度可以提供相当高的音频质量 , 适用于大多数音乐 / 电影 / 多媒体应用 ;
24 位采样精度 : 使用 3 字节数据表示单个音频采样 ; 适用于更高动态范围和更低噪声的应用场景 , 如专业录音室或音频后期制作 ; 该采样精度提供了 $2^{24} = 16777216$ 个不同的值 , 可以捕获更细微的音频细节 ;
32位采样精度 : 使用 4 字节数据表示单个音频采样 ; 32 位的采样精度提供了非常高的动态范围和信噪比 , 常用于特定的专业领域 , 如 : 数字音频工作站 " DAW , Digital Audio Workstation " , 中的浮点音频处理 ; 这种精度提供了 $2^{32} = 4,294,967,296$ ( 大约 43 亿 ) 个不同的值来表示每个采样点 , 几乎可以消除量化噪声 ;

3、音频通道数

音频通道数 :

单声道 : 单声道音频只有一个声道 , 即声音只能从一个方向传来 , 无法区分左右声道 ; 它通常用于较简单的音频设备 , 如 : 收音机、便携式播放器 ;
双声道 : 又叫 " 立体声 " , 包含左右两个声道 , 左右声道的声音信号经过处理后 , 可以模拟出人耳对声音的定位感 , 使得听者能够感受到声音的方向和立体感 ;
四声道 : 四声道环绕音频在 " 立体声 " 的基础上增加了后置左右两个声道 , 通过更多扬声器的布置 , 提供更加宽广和包围感更强的音频体验 ; 常用于家庭影院系统 ;
5.1 声道 : 前置左、前置右、中置、后置左、后置右五个正常音频声道音箱 , 然后加上一个低音炮是 0.1 的那部分 , 常用于电影院或游戏音频 ;