图像处理理论和应用
计算机视觉概述
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄像头代替人眼对目标进行图片信息采集,然后用电脑代替人脑对目标进行进一步处理并获得相应场景。
计算机视觉的任务
图像分类
目标检测
图像分割
图像生成
超分辨率
风格迁移
图像修复
数字图像处理基础
图像处理技术划分
字图像处理分为三个层次:低级图像处理、中级图像处理和高级图像处理(图像处理、图像分析和图像理解)
- 图像处理是低层操作,它主要在图像像素级上进行处理,处理的数据量非常大;
- 图像分析则进入了中层,经分割和特征提取,把原来以像素构成的图像转变成比较简洁的、非图像形式的描述;
- 图像理解是高层操作,它是对描述中抽象出来的符号进行推理,其处理过程和方法与人类的思维推理有许多类似之处。
图像数字化
什么是采样?
将空间上连续的图像变化为离散的点。
什么是量化?
将采样点的传感器信号转换成离散的整数值。
图像表达
灰度图
灰度图,都只有一个通道,单通道记录了像素点的亮度信息,每个数字都是在范围0-255之间的整型,0表示最暗(黑色),255表示最亮(白色)
RGB
对于彩色图片,更普遍的表达方式是RGB颜色模型。RGB颜色空间中每个像素点有三个维度,分别记录在红(Red)、绿(Green)、蓝(Blue)三原色分量上的亮度。
HSV
HSV (Hue, Saturation, Value)颜色的参数分别是:色调(H),饱和度(S),明度(V)。
根据颜色的直观特性创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。
图像预处理技术
图像处理一般流程
灰度变化
亮度变化
亮度:也称为灰度,它是颜色的明暗变化,常用 0 %~ 100 % ( 由黑到白 ) 表示。以下三幅图是不同亮度对比。
对比度变化
对比度:是画面黑与白的比值,也就是从黑到白的渐变层次。比值越大,从黑到白的渐变层次就越多,从而色彩表现越丰富。
直方图变化
直方图:表示图像中具有每种灰度级的象素的个数,反映图像中每种灰度出现的频率。图像在计算机中的存储形式,就像是有很多点组成一个矩阵,这些点按照行列整齐排列,每个点上的值就是图像的灰度值,直方图就是每种灰度在这个点矩阵中出现的次数。我们可以具体看一下下面两个不同图形的灰度直方图:
几何矫正
图像增强
图像滤波
空间滤波:是一种局部处理方式,像素p的输出值由输入图像中像素p及其邻域N中的像素值确定。
计算方法:将邻域N的像素值和一个与邻域同样尺寸的子图像进行模板运算。子图像被称为模板、核或滤波器。
卷积与图像去噪
去除噪声比较简单的方法是加权平均法,即将噪声与周围的像素点加权平均一下,这就是卷积。将图像中的噪声通过卷积操作得到去噪后的像素点。如果将图像上的所有像素点都操作一遍就得到了一张去噪后的图,将算子中的1/9制作成模板,这个模板是1/9组成的3x3矩阵,又叫做卷积核(滤波核)。
模板卷积
模板排序
中值滤波
卷积的示例
卷积与边缘提取
边缘定义
边缘:图像中亮度明显而急剧变化的点。
边缘检测算子
一阶梯度:Prewitt梯度算子、Sobel梯度算子。
二阶梯度:Laplacian梯度算子。
参照:详解Python+OpenCV对图像进行形态学操作
参照:详解Python+OpenCV对图像进行边缘检测操作
图像预处理在深度学习中的应用–图像分类
图像特性
局部感知
人对外界的认知是从局部到全局的,而图像的空间联系也是局部的像素联系较为紧密,而距离较远的像素相关性则较弱。
图像不变性
同一图像在不同位置、不同角度的旋转、不同大小、不同光照等条件下,都会被识别为同一物体,这一特点就是不变性。
参照:深度学习之CNN卷积神经网络详解以及猫狗识别实战