高斯滤波器和LoG(Laplacian of Gaussian)的关系

@[TOC](高斯滤波器和LoG(Laplacian of Gaussian)的关系)

卷积和求导的关系

对于2D函数f(x,y), 其对x的偏导为:
∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \frac{\partial f(x, y)}{\partial x}=\lim _{\varepsilon \rightarrow 0} \frac{f(x+\varepsilon, y)-f(x, y)}{\varepsilon} xf(x,y)=limε0εf(x+ε,y)f(x,y)
对于离散的数据,我们可以用有限差分去近似其偏导:
∂ f ( x , y ) ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) 1 \frac{\partial f(x, y)}{\partial x} \approx \frac{f(x+1, y)-f(x, y)}{1} xf(x,y)1f(x+1,y)f(x,y)
eg:
对下面的老虎图片分别进行x方向和y方向的求导:
x方向求导得到的是竖直方向的边为主
y方向求导得到的是水平方向的边为主
在这里插入图片描述
上面的求导就可以用黄色所示的卷积核来近似求导的过程:

  • 对于x方向的求导:
    ∂ f ( x , y ) ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) 1 \frac{\partial f(x, y)}{\partial x} \approx \frac{f(x+1, y)-f(x, y)}{1} xf(x,y)1f(x+1,y)f(x,y)
    这里的x,y表示像素点的位置,(x+1,y)这个点即表示(x,y)的右边的像素点。
  • 对于y方向的求导:
    ∂ f ( x , y ) ∂ y ≈ f ( x , y + 1 ) − f ( x , y ) 1 \frac{\partial f(x, y)}{\partial y} \approx \frac{f(x, y+1)-f(x, y)}{1} yf(x,y)1f(x,y+1)f(x,y)

所以,由上面的例子可知:求导可以用卷积来代替的!

Image gradient

∂ f ( x , y ) ∂ x \frac{\partial f(x, y)}{\partial x} xf(x,y)可以得到竖直方向的边
∂ f ( x , y ) ∂ y \frac{\partial f(x, y)}{\partial y} yf(x,y)可以得到水平方向的边

图像的梯度:

∇ f = [ ∂ f ( x , y ) ∂ x , ∂ f ( x , y ) ∂ y ] \nabla f=[\frac{\partial f(x, y)}{\partial x},\frac{\partial f(x, y)}{\partial y}] f=[xf(x,y),yf(x,y)]

什么是梯度: 梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模)。

梯度沿着函数值增大的方向!!!

梯度的方向:

θ = tan ⁡ − 1 ( ∂ f ( x , y ) ∂ x / ∂ f ( x , y ) ∂ y ) \theta = \tan^{-1}(\frac{\partial f(x, y)}{\partial x}/\frac{\partial f(x, y)}{\partial y}) θ=tan1(xf(x,y)/yf(x,y))
在这里插入图片描述

Effects of noise

找边需要两次卷积操作

在这里插入图片描述
在这里插入图片描述
上图中 g g g 为高斯核,可以平滑噪声, f ∗ g f*g fg 后就没有噪声了,再对 f ∗ g f*g fg 进行求导就可以求出跳跃的位置了。由卷积和求导的关系可知,这里的求导也可以用卷积实现。

所以上图中从f中求出其跳跃的位置需要两次卷积:1. f*g 来去噪 2. 对 f ∗ g f*g fg进行卷积来求边(即跳跃的位置)

找边只需一次卷积操作

在这里插入图片描述
如上图所示,因为 d d x ( f ∗ g ) = f ∗ d d x g \frac{d}{dx}(f*g)=f*\frac{d}{dx}g dxd(fg)=fdxdg, 所以我们可以直接先对高斯核进行求导(这个高斯核是我们已知的,所以我们可以提前对高斯核求导), 再去和 f 卷积。

这样就是把对 f 的处理就变成了 只用 1 次卷积!

Gaussian pyramid

在这里插入图片描述
blur ->subsample ->blur -> subsample
在这里插入图片描述

Laplacian of Gaussian(LoG)

Laplacian image pyramid

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
上图的高斯金字塔在存储的时候,需要存储subsample后的原图,而原图的信息量是很大的,所以存储占空间
上图的拉普拉斯金字塔在存储的时候,只需要存储各级残差和最后的一张subsample后的原图即可,对于残差图,很多地方都是0,可以压缩存储,节省存储空间。

在这里插入图片描述
在这里插入图片描述
用 Laplacian of Gaussian 也可以去找边的,即卷积后的 zero crossings就是边。

思考:

  1. Laplacian of Gaussian是对称的图像?
  2. Laplacian of Gaussian 积分为0?
  3. Laplacian of Gaussian的 σ \sigma σ越大,“帽子”越矮,“帽子”的范围越大?
    σ = s c a l e = b a n d w i d t h \sigma=scale=bandwidth σ=scale=bandwidth

在这里插入图片描述
上图中最后一个卷积的结果的峰值最小,说明Laplacian filter和最后一个original signal的 bandwidth 一致(characteristic scale)。受此启发,可以用于多尺度检测
在这里插入图片描述
如上图所示,用不同尺度的卷积核去卷积,得到响应值最大的就是尺度相匹配的!

这个知乎讲的怪好!

猜你喜欢

转载自blog.csdn.net/weixin_43845922/article/details/129825821