通信系统之信源编码

上次博文讲到了《通信系统之信道(四)》,信道的学习暂时告一段落,这只是入门性的东西,细节性的东西还需继续深入研究;接下来讲解信源编码相关知识。

信源编码是什么?

为什么要进行信源编码?



对于数字通信系统而言,因为信源是模拟信息,所以信源编码主要完成把模拟信号转换成数字信号;



若信源为离散信息,那么信源编码的主要任务就是将信源的离散符号变成数字代码,并尽量减少信源的多余度,以提高通信的有效性。


为什么要使信源减少冗余?

扫描二维码关注公众号,回复: 1703706 查看本文章

比如信源编码就是将信息符号T和F变换成0和1,或00和11等其他码组,显然0和1的编码效率最高,而用00和11去编码就显得有些多余了,信道的带宽是有限的,我们当然是希望在有限的带宽内传输更多有效的信息;


是不是去除越多的冗余度越好呢?

凡事都有度,也并不是凡事都要做到极限:


比如说CD的音质很好,但文件很大,不便于存储和下载,把他压缩为MP3后,文件虽然变小了很多,但音质也不会有所损失,这就要看实际情况,取其平衡了。如果能达到规定的质量标准,那么当然是去除冗余越多越好了。

对于前面讲到的概念,这里用一个实际的例子来说明去除冗余的好处:

我们国家的有线电视系统每帧图像有625行,


采用4:3的宽高比,


每个像素均有不同成分的红绿蓝三基色合成,若以数字化真彩色表示,每个基色编为8bit码,


因此,每帧图像包含的像素数,比特数,信息传输速率,所需信道带宽,实际信道带宽,信源压缩倍数为:


电视信号压缩了这么多倍,但对于我们来说,收视质量还是可以接受的;

所以说好的信源编码是既能满足通信的质量要求,又能提高通信效率的,这么说来,作为信源编码之一的语音编码,其编码技术在通信系统中是很关键的,尤其在移动通信系统中,宝贵的无线资源要求每个用户占用的频段越窄越好,因此:


语音编码的种类:


波形编码是在时域对模拟话音的电压波形按一定的速率抽样,再将幅度量化,对每个量化点用代码表示,



解码是相反的过程,将接收的数字序列,经解码和滤波后,恢复成模拟信号;

波形编码能提供很好的话音质量,但编码信号的速率较高,一般应用在信号带宽要求不高的通信中,如PCM等,其编码速率在16Kbit/s~64Kbit/s。


参量编码,又称声源编码,是以发音模型作基础,从模拟话音提取各个话音参量,并对这些特征参量进行量化编码,可实现低速率语音编码:


但话音质量只能达到中等,如线性预测编码;

混合编码:

是将波形编码和参量编码优点结合起来,既有波形编码的高质量优点,又有参量编码的低速率优点,其压缩比达到4Kbit/s~16Kbit/s;


在移动通信系统中,一般采用混合编码技术,如下:


PCM编码的介绍:

PCM编码的由来:在数字通信系统中,信源和信宿都是模拟信号,而信道传输的却是数字信号,可见在数字通信系统中的发信端,必须要有一个将模拟信号转换成数字信号的过程,同时在接收端也要有一个将数字信号还原成模拟信号的过程,


那么如何将一个模拟信号转换成一个数字信号呢?


抽样:

所谓抽样就是不断的以固定的时间间隔,采集模拟信号当时的瞬时值,假设一个模拟信号f(t)通过一个开关,而开关的输出y(t)与开关的状态有关,


当开关处于闭合状态时,开关的输出就是输入,即y(t)=f(t)


当开关处于断开状态时,输出y(t)=0;

可见,如果让开关受到一个窄脉冲控制,脉冲出现时,开关闭合,脉冲消失时,开关断开,


则输出y(t)即使一个幅值变化的脉冲串,


每个脉冲的幅值就是该脉冲出现时刻的输入信号f(t)的瞬时值,


此时,y(t)就是对f(t)抽样后的信号,或样值信号;

下面讲解量化编码:

这是一个以  为时间间隔的窄脉冲序列p(t),


因为要用它进行抽样,所以称之为抽样脉冲,v(t)是待抽样的模拟电压信号,


抽样后的离散信号k(t)的取值分别为:


可见取值在0~6之间是随机的,也就是说可以有无穷个可能的取值,要是原封不动的保留这无穷个值,那编码的效率无从谈起!

因此必须要把无穷个可能的取值,变成有限个,怎么变呢?

立一些标杆数值,将这些值就近向这些标杆靠拢,


比如对k(t)的取值我们将它四舍五入成一些整数,得到m(t),


则m(t)的取值变为:


总共只有0~6,这7个可能有限的取值,


这个过程就称为量化;

从概念上讲,m(t)已经变为数字信号,但还不是实际应用中的二进制数字信号,因此对m(t)用3位二进制码元进行自然编码,就得到了数字信号,


从而完成了ADC,实现了脉冲编码调制;


疑问解答:

从上述过程中的抽样,量化,编码的PCM过程中,没有发现明显的调制概念,那为什么叫脉冲编码调制呢?

其实调制的概念体现在抽样和编码的过程中,在实际工程中,我们前面提到的可控开关,通常是用一个乘法器实现,如下图:


假设模拟电压信号v(t)通过乘法器与一个抽样窄脉冲p(t)相乘,得到一个幅度随v(t)变化而变化的窄脉冲序列k(t), 这正是幅度调制的概念;

与模拟中的调幅不同的是,这里的载波不再是正弦信号,而是抽样窄脉冲序列,调制信号的信息不再通过脉冲序列的幅度或宽度等参量表示,而是用0和1不同的码元组合即编码携带信息;

量化的原则:

量化是把一个函数的无限个数值的集合映射为一个离散函数的有限个数值的集合,通常采用四舍五入的原则进行数值量化;

是不是量化间隔越小越好呢?

确定后的量化取值叫量化值,


量化值的个数称为量化级,


相邻两个量化值之差就是量化间隔,


从前面我们可以看到,v(t)的样值信号k(t)和量化后的样值信号m(t)是不一样的,

比如k(0)=0.2, m(0) = 0,而收信端恢复的信号是量化后的信号m(t),而不能恢复出k(t),这样就使得收发的信号之间有误差,


显然,这种收发误差是由量化引起的,我们称其为量化误差,或量化噪声,


比如,上例中,量化间隔为1,由于采用四舍五入量化,因此量化噪声的最大值为0.5;


一般来说,量化间隔都一样的量化叫做均匀量化;


那么如果在一定的取值范围内,把量化值多取几个,也就是把量化间隔变小,则量化噪声就会减小,比如:


显然量化噪声与量化间隔成正比,量化间隔越小,量化噪声越小,但在实际中,不可能对量化分级过细,因为过多的量化值将直接导致系统的复杂性和经济型,可靠性,方便性,维护使用性等指标的恶化。

问题:尽管信号幅值大,和信号幅值小,使得绝对量化噪声是一样的,都是0.5个量化间隔,但相对误差却悬殊很大,也就是说对信号的影响大小并不一样,比如上例中,



相对误差的科普:

相对误差指的是测量所造成的绝对误差与被测量(约定)真值之比乘以100%所得的数值,以百分数表示。一般来说,相对误差更能反映测量的可信程度。设测量结果y减去被测量约定真值t,所得的误差或绝对误差为Δ。将绝对误差Δ除以约定真值t即可求得相对误差。

相对误差大,意味着小信号的信噪比小,能否找到了一种方法既提高了小信号的信噪比,又不过多的增加量化级,细化量化间隔?

非均匀量化法登场:


实现这种思路的方法是压缩与扩张,如下图,脉冲A和脉冲B是两个样值,作为压缩器的输入信号,通过压缩后变为


可见,与A基本上没有变化,而却比B大了许多,这正是我们需要的压缩特性,在收信端作为扩张器的输入信号,经扩张后还原为样值A和样值B,


现在我们来看一下,小信号的信噪比的变化情况,在下图中,没有经过压缩器的相对误差为1/2,经过压缩器后的相对误差为1/6,可见相对误差减小了,这也就意味这信噪比增大了。


压缩特性经常采用对数压缩特性,也就是压缩器的输出与输入之间,近似成对数关系,对电话信号而言,对数压缩特性又分为:


我国采用A律。

因此可以在抽样器后面加上一个叫压缩器的信号处理电路,


该电路的特点是对弱小信号有比较大的放大倍数,而对大信号的增益却比较小,抽样后的信号经过压缩器后就发生了畸变,大信号部分与进压缩器前差不多,没有得到多少增益,而弱小信号部分却得到了不正常的放大,相比之下,大信号好像被压缩了,压缩器由此而得名;


对压缩后的信号再进行均匀量化,就相当于对抽样信号进行了非均匀量化,那么,在收信端为了恢复原始抽样信号,就必须把接收到的经过压缩的信号,还原成压缩前的信号,完成这个还原过程的电路就是扩张器,


它的特性正好与压缩器相反,对小信号压缩,对大信号提升;


为了保证信号的不失真,要求压缩特性与扩张特性合并后为一条直线,


也就是说信号通过压缩再通过扩张,实际上好像通过了一个线性电路,显然单独的压缩和扩张对信号进行的是非线性变换。

下面讲讲编码:


比如PCM码组,就是用二进制码组去表示量化后的十进制量化值,


所涉及的问题主要有两个:


而码型就是电脉冲存在的形式,这个问题涉及到了基带的传输,后面专门讲解;

如何确定二进制数的位数?


比如3位二进制数就有8种不同的状态组合:



显然,码组的长度与量化级数有直接的关系,码组的长度越长,码组个数就越多,可以表示的状态就越多,则量化级数就可以增加,量化间隔随着减小,量化噪声也随着减小,


但码组长度越长,对电路的精度要求就越高,同时要求码元速率就越高,从而要求信道带宽越宽,对于A律来说,每个码组的长度为8个二进制数;

当把一个模拟信号通过抽样处理转换成一个离散信号后,凭什么认为该离散信号可以携带原始信号的全部信息呢?

凭什么认为能从该离散信号恢复出原始信号呢?

模拟信号可以转换成数字信号的理论就是抽样定理,包括低通抽样定理和带通抽样定理:

低通抽样定理:



简单说明抽样定理:









若不满足条件:


习题解答:



由于话音信号的带宽为4KHz,由低通抽样定理可知,奈奎斯特抽样频率为2*4KHz= 8KHz,即每秒抽样8000个样值点,当采用8级量化时,每个样值点需要3个二进制码元,所以信息传输速率为 ,由于是二进制编码,故,128级量化同理;

带通抽样定理:

带通信号频谱不是从直流开始,


设信号带宽为:


通常将的信号称为带通信号;

下面定性分析带通抽样定理:

为讨论方便,设


先把带通信号看成一个低通信号,将频谱的上下边带用虚线连接起来,


用抽样频率对其进行抽样,


得到如图所示的样值信号频谱,


从图中可以看到,频谱没有重叠,但是上下边带之间的频带却是空的,如果要用低通滤波器恢复原始信号,其带宽必须等于3B,


如果我们按带通信号对待,用抽样频率对其抽样,就会得到下图频谱,可见,频谱仍不重叠,而占用频带的带宽却减小了,此时,低通滤波器的带宽只需等于原始信号的带宽B即可,



上面只是举了一个特例,,对于一般情况而言,只要,抽样频率满足,


就可以保证原始信号f(t)完全由样值信号y(t)确定,


其实只要确定信号的频率范围就可以算出带通信号的最低抽样频率了,

例如:


总结:



猜你喜欢

转载自blog.csdn.net/reborn_lee/article/details/80732398