1. 像素基本操作
1.1 读取、修改像素
可以通过[行,列]坐标来访问像素点数据,对于多通道数据,返回一个数组,包含所有通道的值,对于单通道数据(如gray),返回指定坐标的值,也可以通过 [行,列,通道index] 来访问某坐标某通道的值。
可以直接通过坐标修改像素值
>>> img[100,100] =[255,255,255]
>>> print( img[100,100] )
[255255255]
然而直接像上面这样去读取、修改每个像素的值,效率是比较低的,可以使用下面的方法,效率是更高的
1.2 读取图像属性
读取图像尺寸,返回一个元组 (行,列,通道数)
>>> print( img.shape )
(342, 548, 3)
读取像素大小, 行 列 通道数
>>> print( img.size )
562248
像素数据类型
>>> print( img.dtype )
uint8
1.3 图像ROI操作
可以直接编辑像素区域,例如把图像左下角50*50的像素复制到左上角
1.4 分割、合并通道
有些情况下需要对图像的某一通道数据进行操作,此时会用到分割、合并通道数据
>>> b,g,r =cv2.split(img)
>>> img =cv2.merge((b,g,r))
或者
b = img[:,:,0]
假设想编辑红色通道的数据,全部设置为0,不需要这样分割后编辑, img[:,:,2] = 0 这样即可。cv2.split操作是一个很耗时的操作,可以用numpy索引替代的操作,尽量用numpy索引来做。
1.4 生成图像边框
使用 cv2.copyMakeBorder 函数可添加图像边框,支持多种边框算法
上面的例子可以比较直观的看到各种border的效果,同时也能发现,python版的api与cpp版本的相比,默认初始化了一块原始图尺寸+各方向边框尺寸的图像内存,作为内置的dst参数。
输出尺寸:(525, 700, 3) (725, 900, 3)
2. 图像的基本算术操作
2.1 图像相加
图像相加,两个图像应该有相同的shape,或者图像和一个标量相加,或者图像和一个与其通道数相同的一维数组相加。
opencv的相加与numpy相加时,在超出数据类型范围时的处理不同
cpp版本的api还支持mask等参数
2.2 图像混合
opencv通过 cv::addWeighted 函数提供了将两个图像混合在一起的方法
dst=α⋅img1+β⋅img2+γ
通过cv2.seamlessClone函数还能做更精细的图像局部融合。