【学习笔记】数字图像处理(1):图像特征提取

1.特征代表性和可区分性
一幅图像中不同类别的对象差异越大越好。比如在区分乒乓球和足球时,图像的纹理特征就是很不错的特征,因为足球一般有六边形纹理结构,而乒乓球没有。
2.稳定性
同一类别图像的特征应该具有类似的特征值。保证类别内图像的相似度大于类别间图像的相似度。如,在区分成熟的苹果与不成熟的苹果时,颜色是一个比较好的特征,因为不成熟的苹果通常呈青色而成熟的苹果通常呈黄色或红色尺寸大小这个特征在区分苹果成熟与否时,不是一个稳定的特征
3.独立性
图像特征应该彼此独立,尽量减少彼此的关联性,图像之间的关联性会影响内容的表达。如,苹果的直径和苹果的终了就属于关联性较强的两个特征,他们都可以反映苹果的大小,如果同时使用两个特征就会显得冗余。

一、颜色特征提取

1.1颜色直方图

颜色直方图用于描述图像中像素颜色的数值分布情况,可以反映图像颜色的统计分布和图像的基本色调。

1.1.1一般颜色直方图

假设 s ( x i ) {s( x _{ i } ) } s(xi) 为图像 F {F} F中某一特定颜色 x i {x_{i}} xi的像素个数,图像 F {F} F中像素总数为 N = Σ j s ( x j ) {N=\Sigma_{j}s(x_{j})} N=Σjs(xj),则 x i {x _{ i } } xi像素出现的频率为
h = s ( x i ) N = s ( x i ) Σ j s ( x j ) h=\frac{s(x_{i})}{N}=\frac{s(x_{i})}{\Sigma_{j}s(x_{j})} h=Ns(xi)=Σjs(xj)s(xi)
整个图像 F {F} F的一般颜色直方图可以表示为
H ( F ) = [ h ( x 1 ) , h ( x 2 ) , . . . , h ( x n ) ] H(F)=[h(x_{1}), h( x_{2} ),...,h(x_{n})] H(F)=[h(x1),h(x2),...,h(xn)]
其中n表示某类颜色取值的个数。

一般图像的直方图如下

图像
在这里插入图片描述
一般颜色直方图法对图像的旋转、小幅平移、小幅缩放等变换不敏感,对图像质量的变化也不敏感。

1.1.2全局累加直方图

假设图像 F {F} F中的某一特征的一般颜色直方图为 H ( F ) = [ h ( x 1 ) , h ( x 1 ) , . . . , h ( x n ) ] {H(F)=[h(x_{1}),h(x_{1}),...,h(x_{n})]} H(F)=[h(x1),h(x1),...,h(xn)],令
λ ( x i ) = ∑ j ≤ i h ( x j ) {\lambda( x _ { i } ) = \sum _ { j \le {i} } h( x_{j} ) } λ(xi)=jih(xj)
表示颜色小于或者等于 x i x_{i} xi的所有元素的一般颜色直方图的累加和,则图像 F F F的该类特征累加直方图可以表示为:
λ ( F ) = [ λ ( x 1 ) , λ ( x 1 ) , . . . , λ ( x n ) ] { \lambda (F) = [\lambda(x_{1}), \lambda(x_{1}) ,...,\lambda(x_{n})] } λ(F)=[λ(x1),λ(x1),...,λ(xn)]
像素值相邻的频数在全局累加直方图的位置也相邻

你可以这样去理解,一般颜色直方图相当于一个概率密度函数,而全局累加直方图是一个分布函数,也就是累加直方图是一般直方图的积分
F ( x ) = ∫ − ∞ x p ( x ) d x { F(x)=\int_{-\infty}^{x} p(x)dx } F(x)=xp(x)dx
λ ( x i ) = ∑ j ≤ i h ( x j ) { \lambda(x_{i} )= \sum _ { j \le {i} } h( x_{j} )} λ(xi)=jih(xj)

1.1.3主色调直方图

在一幅图像中,不同颜色值出现的概率不同,而且通常情况少数几种颜色就能涵盖整个图像的主色调。

主色调直方图就是计算每种颜色出现的频率,选择频率最高的颜色作为主色调,主色调直方图能够抑制图像中噪声的影响。

1.2颜色矩

矩是一种重要的统计量,常用于表征数据的分布特点。在统计中,一阶矩表示均值,二阶矩表示方差,三阶矩表示偏移度。图像的颜色矩用于对图像内的颜色分布进行表征。

  • 对于数字图像,一阶矩定义为:
    μ i = 1 N ∑ j = 1 N P i j { \mu_{i} = \frac{1}{N} \sum_{j=1}^{N} P_{ij} } μi=N1j=1NPij
    其中 P i j P_{ij} Pij表示数字图像 P P P的第 i i i个图像通道的第 j j j个像素的值, N N N表示图像中像素的个数
  • 二阶矩定义为:
    σ i = [ 1 N ∑ j = 1 N ( P i j − μ i ) 2 ] 1 / 2 { \sigma_{i} = [\frac{1}{N} \sum_{j=1}^{N} ( P_{ij} - \mu_{i}) ^{2} ]^{1/2} } σi=[N1j=1N(Pijμi)2]1/2
  • 三阶颜色矩定义为:
    s i = [ 1 N ∑ j = 1 N ( P i j − μ i ) 3 ] 1 / 3 { s_{i} = [\frac{1}{N} \sum_{j=1}^{N} ( P_{ij} - \mu_{i} )^{3} ]^{1/3} } si=[N1j=1N(Pijμi)3]1/3

1.3颜色集

颜色集又可以称为颜色索引集,其是对图像颜色直方图的一种近似。颜色集方法的步骤是:将图像从RGB空间转换到HSV空间,并将颜色空间量化为若干个边长均等的小立方体;第二,根据图像的色彩将图像划分为若干个子区域;第三,使用量化空间中的某个颜色分类索引每个子区域,将图像表示为一个二进制的颜色索引集。

最简单的颜色集可以通过设置阈值的方式。例如给定某一颜色值 m m m,给定其阈值 τ m \tau_{m} τm,由颜色直方图生成颜色集 c c c可表示为
c [ m ] = { 1 , h [ m ] ≥ τ m 0 , 其 他 c[m]=\left\{ \begin{aligned} 1,h[m] \ge\tau_{m} \\ 0,其他 \end{aligned} \right. c[m]={ 1,h[m]τm0,
其中 h [ m ] h[m] h[m]表示直方图中颜色值为 m m m对应的位置处的分量

1.4颜色聚合向量

颜色集合向量的核心思想是将颜色直方图的每个颜色量化区间的像素分为两部分,如果该颜色量化区间中的某些像素占据的连续区域大于指定阈值,则将该区域内的像素作为聚合像素,否则为非聚合像素

颜色聚合向量可表示为 < ( α 1 , β 1 ) , . . . , ( α n , β n ) > <(\alpha_{1}, \beta_{1} ),...,(\alpha_{n}, \beta_{n})> <(α1,β1),...,(αn,βn)>,其中 α i \alpha_{i} αi β i \beta_{i} βi分别代表颜色直方图的第 i i i个颜色量化区间中的聚合像素和非聚合像素的数量。

猜你喜欢

转载自blog.csdn.net/AlepH_Sin/article/details/111150752