音频相关知识

目录

声音的本质

横波与纵波

为什么固体中既能传输横波,又能传输纵波,液体气体中只能传输纵波

声波

超声波与次声波

声音的三要素

音调

响度

音色

噪声

媒体音频

声道

分类

麦克风工作原理

模数转换

扬声器的使用原理

音频压缩类别

音频的码率

音频格式

声音的本质

声音的本质:声音的本质是波在介质中的传播现象,声波的本质是一种波,是一种物理量。 两者不一样,声音是一种抽象的,是声波的传播现象,声波是物理量。

声音产生的原因:物体的震动形成声波

声源:正在发声的物体,通过声源发出声波

人耳接受声音的方式以击鼓为例:击鼓时振动的鼓面会带动周围空气发生震动,气体分子通过相互碰撞把震动传导到耳道末端的鼓膜,再由三块听小骨(锤骨,砧骨,镫骨)放大最终传到耳蜗内,耳蜗通过感应毛细胞将震动转化为生物电信号传递给大脑,因此就听见了鼓声。

横波与纵波

  • 横波: 横波也称“凹凸波”,是质点的振动方向与波的传播方向垂直。
  • 纵波:纵波是质点的振动方向与传播方向平行的波

注意:

  • 在横波中突起的部分为波峰,凹下部分叫波谷。波长通常是指相邻两个波峰或波谷之间的距离,在纵波中波长是指相邻两个密部或疏部之间的距离。
  • 声音通常是纵波,也有横波
  • 固体中既能传播横波,又能传输纵波;液体中只能传输纵波
  • 同一个波在不同介质中的波速不同,而周期、频率不变
  • 波在固体传播最快。波的传播依靠介质,传播的是波动,不是能量,所以其传播速度与介质密度有关,所以声波在固体中的传播速度最大,液体其次,空气中最慢.
  • 波具有反射,折射,衍射,叠加,干涉等特性

为什么固体中既能传输横波,又能传输纵波,液体气体中只能传输纵波

横波是通过质点间的拉动形成的,前一个质点拉动后一个质点,形成机械横波;而纵波是通过质点间的挤压。固体中,分子分子间的作用力比较强,当一个质点发生运动时,后面一个质点很容易收到前一个质点的拉动从而形成机械横波;而相反,气体分子间作用力比较弱,不容易传播拉动,因此不容易形成横波.
结论:超固态,固态这些分子间作用力强的状态,容易形成机械横波;而气态,等离子态这些分子间作用力弱的状态,不容易形成机械横波. 

本质:空气只能通过压缩而产生相互作用力,故空气只能传播纵波,不能传播横波。这是由介质减相互作用力特点决定的

声波

  • 波速:单位时间内震动传播的距离
  • 波长:同一波线上两个相位差2Π的点之间的距离
  • 周期:空气分子来回震动所需的时间
  • 频率:周期的倒数(单位Hz)
  • 振幅:空气分子从原点到最大位移的距离 

超声波与次声波

  • 次声波:声音频率在20Hz以下的声波
  • 超声波:声音频率在20000Hz以上的声波

注意:超声波的能量大,且沿着直线传播,次声波的传输距离远,不易衰减。 

声音的三要素

  • 音强:描述声音的大小
  • 音调:描述声音的高低
  • 音色:描述声音的音品

音调

含义:物理学中把声音的高低称为音调

决定因素:与发声物体的振动快慢(频率)有关。频率越大音调越高,频率越小音调越低

响度

含义:物理学中,把声音的强弱称为响度,也称音强(单位:分贝——dB)

决定因素:与发声体的振幅和距离发声体的远近有关。振幅越大,响度越大;振幅越小,响度越小

音色

含义:声音的品质与特色(不同声音表现在波形方面总是有与众不同的特性)

注意:音色是辨别各种声音的依据

决定因素:发声体的材料、结构等。

音色的区分:波形图的形状即波形图上细小的波形差距指音色(波谱)。

噪声

物理学中的含义:噪声指发声体做无规则震动时发出的声音

环境学中的定义:影响人们正常休息,学习和工作的声音,以及对人们要听的声音起干扰作用的声音

媒体音频

声道

含义:记录和播放声音的通道

分类

  • 单声道:只含一个声音的通道
  • 双声道:含有两个声音的声道

注意:

  • 双声道就是实现立体声的原理,在空间放置两个互成一定角度的扬声器,每个扬声器单独由一个声道提供信号。 
  • 在单声道的音响器材中,只能感受到声音、音乐的前后位置及音色、音量的大小,而不能感受到声音从左到右等横向的移动,双声道人们听到声音时可以根据左耳和右耳对声音相位差来判断声源的具体位置。

麦克风工作原理

磁生电:如果把一个回路的部分导线做切割磁感线运动则在这条导线中便会产生电流

原理:人说话会导致振膜的震动,当振膜捕获到震动以后,会带动线圈一起 发生位移致使导线做切割磁感线运动,从而产生电流,此时只需要检测线圈两级的电压便可以得到声音的波形图,机械震动就会被转化成了电压信号。

模数转换

前言:麦克风捕获到的电压信号是模拟信号而计算机只能存储0101的数字信号,此时我们需要对电压曲线进行量化也就是模数转换(ADC-【analog-to-digital converter】)

原理:AD芯片会每隔几微秒对麦克风线圈的电压波形图进行一次打点采样,得到每一点的电压值并把他们转化成二进制数,之后按照时间次序排列起来最后就得到一份音频文件。

注意:

  • 采样次数越高,两次采样的间隔时间越短,经过量化以后的波形图也就最接近原始数据
  • 奈奎斯特采样定律(Nyquist):又称为采样定律,采样率大于或等于连续信号最高频率分量的2倍时,采样信号可以用来完美重构原始连续信号(因为人耳听到声音频率最大为20000Hz,因此采样率只要高于40000Hz就可以还原出原本的声音了)
  • 采样率:一秒采样多少次就是音频的采样率
  • 采样精度:也叫位深,其是对模拟信号的幅度轴进行数字化,它决定了模拟信号数字化后的动态范围

采样精度的理解:采样精度为1位数,则有0/1【2的1次方】两种状态,分别对应静音与发声,两位数则有四种状态可选00,01,10,11【2的2次方】)这里几位数便是几bit(比特)采样精度只要高于16bit量化导致的音频失真就几乎听不到了,现在的音频文件大多是24bit也就是y轴有2的24次方个台阶足以细化声音的各种细节最后再把这些信息(二进制数据)按照时间次序排列起来最后就得到一份音频文件。

扬声器的使用原理

电生磁:一根通电的导线周围会存在磁场,如果将导线盘成一个圈,那么磁场便会叠加起来。

数模转换:因为线圈只能接受电压波形图这种模拟信号所以数字文件在进入音响后还需要经过DAC进行数模转换通过各种滤波器把原始音频文件重新恢复成平滑的电压波形,最后再施加到扬声器的单元线圈上。 

原理:给线圈通电,通过控制电压和电流来控制线圈内的磁场,和永久磁铁发生吸引或者排斥作用带动振膜震动进而发出声音。

音频压缩类别

  • 无损压缩/未压缩(WAV):直接记录声音的波形,文件体积较大
  • 无损压缩(如flac、alac、ape):类似压缩包(如zip、rar)的压缩方式,压缩过程中不丢失信息,但是体积减小的幅度有限
  • 有损压缩:利用了人类对图像或声波中的某些频率(或响度)成分不敏感的特性,允许压缩过程中损失一定的信息,换来更小的文件体积

音频的码率

含义:也叫比特率,表示每秒音频文件中所含的二进制位数(不是字节数),基本单位bps

注意:

  • 一般来说,当编码方式(不等于文件格式)相同时,码率越高,音频质量越高
  • 若音频时长固定,码率越高,文件体积越大

音频格式

  • MP3:MP3能够以高音质、低采样率对数字音频文件进行压缩。换句话说,音频文件(主要是大型文件,比如WAV文件)能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度。
  • WAV:WAV是微软和IBM共同开发的PC标准声音格式,文件后缀名.wav,是一种通用的音频数据文件。通常使用WAV格式用来保存一些没有压缩的音频,也就是经过PCM编码后的音频,因此也称为波形文件,依照声音的波形进行存储,因此要占用较大的存储空间。
  • MIDI:MID文件格式由MIDI继承而来,它并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。
  • APE:APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。

猜你喜欢

转载自blog.csdn.net/m0_60027772/article/details/130139443