数字图像处理——第二章 数字图像基础

数字图像基础

1. 基本概念

取样:数字化坐标值。
量化:数字化幅度值。

k比特图像:一副数字图像的灰度级为2^k。

动态范围:系统中最大可度量灰度与最小可检测灰度之比。
饱和度:超过这个值的灰度级将被减掉的一个最高值。
对比度:最高和最低灰度级间的灰度差。

空间分辨率是图像中可辨别的最小细节的度量。

线对:假设有一幅宽度为W的垂直线的图,在线间还有宽度为W的线。线 对就是由这样的两条线组成的,其宽度为2W,并且每单位距离有1/2W对线。
图像分辨率:单位距离内可分辨的最大线对数量。

灰度级分辨率:在灰度级别中可分辨的最小变化,指用于量化灰度的比特数。

内插:用已知数据来估计未知位置的数值的处理。

邻接:像素的相邻仅说明了两个像素在位置上的关系,若再加上取值相同或相近,则称两个像素邻接。
通路:从具有坐标(x, y)的像素p到具有坐标(s, t)的像素q的通路是特定像素序列,其坐标为(x0, y0), (x1, y1), ···, (xn, yn)。其中(x0, y0) = (x, y), (xn. yn) = (s, t),且像素(xi, yi)和(x i-1, y i-1)是邻接的。这种情况下,n是通路的长度。

连通性:若S是图像中的一个像素子集,对任意的p, q∈S,如果存在一条由S中像素组成的从p到q的通路,则称p在图像集S中与q连通,连通也分为4连通和8连通。
区域:R是图像的像素子集,若R是连通集,则R为一个区域。
边界:一个区域的边缘或轮廓线。

2. 视觉感知要素

虽然数字图像处理是建立在数学和概率统计表示法的基础上的,但人的感知也起着很大的作用。

2.1 人眼结构中的成像要素

当人类眼球适当的聚焦时,来自眼睛外部的光在视网膜上成像。在视网膜表面分布的分离光接收器提供了图案视觉。

	这种光接收器分为两类:锥状体和杆状体。
	锥状体提供亮视觉,对光线敏感,还具有一定的颜色感知能力。
	杆状体提供暗视觉,没有色彩感觉,对低照明度敏感。

2.2 人眼成像的参考意义

我们将晶状体看成一个具有自适应调节能力得到凸透镜,故人眼的成像模型可以用来描述照相机等图像采集设备的成像。

	在我们实际图像处理的应用中,也可以用人眼成像的模型来计算所观测的目标在照相机上成像的高度,可以利用此来计算照相机拍到的图像对于原始场景有着怎样的物理意义上的分辨率。

人的视觉系统能够适应的光强度级别范围是很宽的。从夜视阈值到强闪光约有10^10量级。

	但人的视觉绝对不能同时在整个范围内工作(不能同时对很强和很弱的光产生视觉),确切的说,它是利用改变视网膜上的接收器(锥状体和杆状体)的灵敏度来完成的,即亮度适应现象。

人体视觉系统对亮度的感知并不是简单的强度函数。

	例如马赫带现象和同时对比现象。

我们感受到的可见光的彩色范围占电磁波的一小部分。

	在原理上,如果可以开发出一种传感器,它可以检测由一种电磁波谱发射的能量,就可以在那一波段上对感兴趣的事件成像。

3. 图像的获取、取样、量化

3.1 图像的感知和获取

我们感兴趣的各类图像都是由“照射”源和形成图像得到“场景”元素对光能的反射或吸收相结合而产生的。

简单的图像形成模型:用二维函数形式f(x, y)表示图像,在特定的坐标(x, y)处,f的值或幅度是一个正的标量,其物理意义由图像源决定。

	当一幅图像从物理过程产生时,它的值正比于物理源的辐射能量。
	因此,f(x, y)一定是非零和有限的,即:0 < f(x, y) < ∞

函数f(x, y)可由两个分量来表征:
(1)入射到观察场景的光源总量,即入射分量i(x, y);
(2)场景中物体反射光的总量,即反射分量r(x, y);

	两个函数合并后形成f(x, y):
	    f(x, y) = i(x, y) r(x, y)
	    0 < i(x, y) < ∞, 0 < r(x, y) < 1
	注:i(x, y)在物理意义上表示一个圆,r(x, y)在物理意义上也不会出现完全的反射,故限制在0(全吸收)和1(全反射)之间。

3.2 图像取样和量化

一幅连续图像的x和y坐标及幅度可能都是连续的,为了把它转换为数字图像,必须在坐标和幅度上都做数字化操作,即取样和量化。

取样和量化的结果是一个实际矩阵。我们可以用矩阵形式表示一幅数字图像,也可以用变量和幅值都是整数的二维函数表示。

3.2.1 数字图像表示

我们把一个数字图像取样为二维阵列时,该阵列包含有M行N列。

	数字化过程对M和N除了必须取整数外没有其他要求。然而出于处理、存储和取样的硬件考虑,灰度值典型的取值是2的整数次幂。
	对于一副大小为M * N,灰度级L = 2^k的数字图像,所需存储空间为b = M * N * k。
	即每个像素的灰度级为2^k,则有k比特空间,共M * N个像素点,故所需空间b的计算如上。

同时需要注意的是,数字图像的原点位于左上角,其中正x轴向下延伸,正y轴向右延伸。此种表示基于如下事实:

  • 许多图像显示扫描都是从左上角开始的,然后一次向下移动一行。
  • 矩阵的第一个元素按惯例应在阵列的左上角,因此将f(x, y)的原点选择在左上角数学上行得通。

3.2.2 空间和灰度级分辨率

取样值是决定一幅图像空间分辨率的主要参数。基本上,空间分辨率是图像中可辨别的最小细节。我们在这里讨论线对,就是为了说明反映原始场景中细节的能力。

	举例来说,我们对一个场景成像,假设图像1mm有100个线对,即1mm中有一百根黑线,还有100根在黑线之间的白线,若要判断我们对场景的成像能反映其中的100条线对,那就要根据成像模型来计算。
	意味着1mm成像的话就要取样出200个像素,才能取样出原场景中的100个线对,即每一个线对要取样一个白色像素和一个黑色像素。

灰度级分辨率是一个相当主观的一个过程。
当没有必要对涉及像素的物理分辨率进行实际度量和在原始场景中分析细节等级时,通常就把大小为M * N,灰度为L级的数字图像称为空间分辨率为M * N像素、灰度级分辨率为L级的数字图像。

我们通过以下两种方式,比较图像尺寸和灰度分辨率对分辨细节的影响:

	改变图像的取样数目,即删除行删除列的方式,可以实现对图像的放大和缩小。
	通过复制行复制列的方式使抽样后的图像复原到原来的大小,会造成细节的损失,产生颗粒。
	其局限性在于,例如我们采用删除行/列的方式,从1024 * 1024的图像减小成512 * 512的图像,只能成整数倍的操作,而不能使用任意数值。

	保持取样数的恒定,只改变灰度级,会使像素点的取值范围减小(使本身不同的灰度级具有了相同的灰度级),会失去某些特征并且出现伪轮廓。

3.2.3 放大和收缩数字图像

这两种操作与取样量化一幅数字图像之间的关键区别是放大和收缩适用于数字图像。

放大和收缩数字图像要求执行两步操作:

  1. 计算新的像素在原图的对应位置
  2. 为这些对应位置赋灰度值

又我们找到的位置可能不在坐标点上,故需插值,有三种方法:

  1. 最近邻法

  2. 双线性插值

  3. 更多邻点的内插

    双线性内插不是一种线性内插方法,因为包含xy项。
    比较常用的方法是双线性内插,可以得到相对满意的结果,在计算上的花费也可以接受。
    

4. 像素间的基本关系

4.1 相邻像素

对于坐标(x, y)的一个像素p有4个水平和垂直的相邻像素,这个像素集称为p的4邻域。

p的4个对角邻像素称为p的D邻域。

4邻域和D邻域合成一起称为p的8邻域。

4.2 邻接性、连通性、区域和边界

令V是用于定义邻接性的灰度值集合。考虑三种类型的邻接性:

  • 4邻接:若q在p的4邻域中,具有V中数值的两个像素p和q是4邻接的。
  • 8邻接:若q在p的8邻域中,具有V中数值的两个像素p和q是8邻接的。
  • m邻接:若q在p的4邻域中,或q在p的D邻域中,且p的4邻域和q的4邻域的交集中没有来自V中数值的像素,则具有V中数值的两个像素p和q是m邻接的。
    在这里插入图片描述
    图1 邻接性图示

如图1所示,b, d与p为4邻接,b, c, d, f, h与p为8邻接,b, d, h是p的m邻接。

	m邻接是8邻接的改进,为了消除8邻接产生的二义性。如图1,8邻接中有两条p到c的通路,采用m邻接避免了多条通路的问题,只可以通过p到b再到c的路径。

如图1所示,hpbc为一条通路,通路的长度为3。

	若(x0, y0) = (xn, yn),则通路是闭合通路。

4.3 距离度量

距离度量函数:对于像素点p(x, y), q(s, t), z(v, w)若满足下列条件,则D为距离度量函数。

  • D(p, q) ≥ 0,正定性(D(p, q) = 0,当且仅当p = q)
  • D(p, q) = D(q, p),对称性
  • D(p, z) ≤ D(p, q) + D(q, z),距离三角不等式

p和q间的距离定义分为:欧氏距离,街区距离和棋盘距离。

	欧氏距离:距点(x, y)的距离小于等于某个值r的像素,是中心在(x, y)且半径为r的圆平面。
	街区距离:距点(x, y)的街区距离小于等于某个值r的像素,是中心在(x, y)的菱形。
	棋盘距离:距点(x, y)的棋盘距离小于等于某个值r的像素形成中心在(x, y)的方形。

p和q间的距离Dm定义为最短m通路的长度。

	值得注意的是,街区距离和棋盘距离与任何通路无关。Dm距离则要讨论连通性的问题。

在这里插入图片描述

图2 距离的度量

如图2所示,p到q的街区距离为5,棋盘距离为3, Dm距离为4。

猜你喜欢

转载自blog.csdn.net/weixin_42262128/article/details/106353738