(含Matlab源码)算术编码(arithmetic coding)及underflow问题

0、文章结构

文章的行文逻辑如下,看官可以根据需要跳读,节省时间。

1、介绍underflow和underflow.

2、问题起源

3、问起探索

4、underflow和underflow的常见情形

5、处理一些溢出问题的小技巧

6、对其中的小技巧的优缺点的比较

1、什么是underflow和overflow

通俗来讲,在计算机中浮点数都是离散的,有限的。因此计算机无法用有限的浮点数来表示无限的实数。在用浮点数表示实数时,很多数都会存在近似误差。其中一种是下溢(underflow)。比如,一个非常接近于零的数值A(实际上A>0),计算机会直接把该数值判为零,虽然实际上它并不为零。另一种数值误差是上溢(overflow),通俗而言,当一个数值a非常接近某一计算机表示的数值b时(实际a<b),计算机用b表示a。

 

2、起源-算术编码(arithmetic coding)作业初识underflow

音频老师布置一个作业,要求写一段程序实现算术编码,被编码的字符串为:ALIALIBABA

关于算术编码的原理详见:https://blog.csdn.net/qingkongyeyue/article/details/75216790?utm_source=blogxgwz8

这个很简单,很快就用matlab写出来了,最终和老师给的答案一样。

接着老师就布置了第二个算术编码的作业,实现对下方字符串的编码,包含空格。

DIGITAL AUDIO TECHNOLOGY AND APPLICATION

代码中输入该字符串,可是range输出值为0。

理论上来讲,range是一个非常非常小的值,但不等于零。

这时,突然意识到,老师上课时讲到的,程序在数值运算中出现underflow。

此时的溢出问题的代码:https://download.csdn.net/download/h763247747/10777261

 

3、关于underflow问题的探索

变量Range被计算机判为零,但是它实际上并不等于零。

那么在matlab中,数值小于多少会被计算机判为零呢?

EPS函数

EPS是MATLAB中的函数,表示浮点相对精度。 对双精度数值来说eps表示从 1.0 到下一个最大双精度数的距离。对单精度数值来说eps表示从 1.0 到下一个最大单精度数的距离。

在command window中输入:help eps

Matlab中变量默认为double类型,所以其判别值为2^(-52),相当于

所以当变量值小于2.22e(-16)时,计算机会直接判为零,这时就需要考虑underflow了。

 

 

 

4、常见数值误差的情形

由此引出另外一个问题:哪些情况会出现数值误差(underflow 或者overflow)?

下方部分内容来自于此论坛:http://www.ilovematlab.cn/thread-242321-1-1.html

论坛里有非常多大佬的精彩留言,让人豁然开朗。

情形1-underflow

计算所得0.4的实际值小于0.4。

 

情形2-由underflow出现的错误

计算机中的计算值为3,并不等于4。

 

情形2-误差精度

控制台输出,可以发现误差越来越大。

 

对于情景2问题的分析

双精度浮点数在计算机中使用科学计数法存储,下图所示浮点数格式。

关于浮点数的更加详细信息:https://www.cnblogs.com/icmzn/p/5060195.html

两个浮点数相减时,会存在有效位数字的误差。

假如1.4-1在计算机中的表示为0.3999….9*e(0)(13个9)。

100000000.4-100000000=(1.000000004-1.00000000)*e(8)=0. 0000000039..9(5个9)*e(8)。

运算精度就变差了,误差也会增大。

 

情形3-overflow

 

 

情形4-由于overflow出现的错误

演示underflow和overflow使用的代码:https://download.csdn.net/download/h763247747/10777601

 

4、处理一些溢出问题的小技巧

4.1、判断两个数是否相等

可以使用如下公式:

abs(a-b) < eps(a) or eps(b)

如果不等式成立,则a,b相等。

4.2、解决underflow问题

比如floor((1.4-1)*10),matlab运行的结果为3,并不等于4。为了得到正确的代码,可以如下改写代码。overflow的问题也可以使用类似思路。

 

4.3、提高精度

a-b的结果小于eps(0)时,为了避免结果被计算机判为零,可以使用其它工具,比如advanpix提高精度,比如精确到小数点后200位。

4.4、移位

比如计算0.0000000000111-0.0000000000101时,可以先都乘以10^10,再相减,然后差值再除以10^10,这样可以提高计算精度。

 

5、提高精度和移位的比较

方法2可以更快的解决matlab中出现的溢出问题,但是方法3更加实用。因为在工程领域,很难找到类似advanpix的工具。比如老板要求在arm芯片上实现对音频的算术编码,这样只能用方法3了。

最后用方法4解决音频算术编码underflow问题的代码:https://download.csdn.net/download/h763247747/10777264

 

 

猜你喜欢

转载自blog.csdn.net/h763247747/article/details/83934723
今日推荐