【Python Opencv 官方教程 】1.图片的存取显示

本系列论文翻译自opencv官方文档

opencv_python tutorial


introduction部分略过,install过程略,由于本人的python环境采用的anaconda集成环境,opencv的安装也是采用的pip安装,这里不再赘述。

本节从图像的读取,显示开始学习,目标

  • 学会读取、显示以及存储图像
  • 将会学到以下几个函数:cv2.imread()、cv2.imshow()、cv2.imwrite()
  • 同时,你将试着使用matplotlib显示图片

let‘s go!

当然,你也许希望阅读英文原版,本文地址如下:

Getting Started with Images


读取图片

采用函数cv2.imread()读取一副图像。

  • 参数一:当前工作目录下的图片文件名,或图像的全路径。
  • 参数二:读取图片的方式标识。
    • cv2.IMREAD_COLOR:默认参数值,读取成彩色图像,忽略alpha通道(透明度)
    • cv2.IMREAD_GRAYSCALE:读取成灰度图
    • cv2.IMREAD_UNCHANGED :原图读取,不忽略透明通道,则读出来的是4通道的图片。
    • tips:以上三个参数值,其实分别是整数1,0和-1.可以直接采用对应的int数作为参数。
    • tips:当读取出错,比如图像路径错误,函数不会抛出异常,但是返回一个空对象None
import numpy as np
import cv2

# Load an color image in grayscale
img = cv2.imread('messi5.jpg',0)

显示图片

调用cv2.imshow()创建一个窗口显示图片,这个窗口会自动适应图片的大小。

  • 参数一:window name,string类型。
  • 参数二:image对象
  • 可以创建任意多的显示窗口,但是窗口名字必须不同
cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.waitKey()

cv2.waitKey(milliseconds)是一个键盘绑定函数(个人理解为一个键盘事件监听函数),它的参数是一个毫秒为单位的时间t,该函数会在t毫秒内,监听键盘事件(超过时间t后,窗口自动关闭)。如果在t时间内,输入任意键盘(触发键盘事件),程序将会继续执行,窗口关闭,且waitkey返回按下的键盘的ascii码(如按esc,返回27)。利用这个函数可以用来做按键检测。

若参数为0(或默认参数None),它将等待无穷大的时间,即窗口不会自动关闭。

Note:这个waitKey函数除了上述作用,还可以用以处理其他许多GUI的事件(比如后续会用到的调试效果的trackbar),所以当你在显示图片的时候必须使用它。

cv2.destroyAllWindows()

该函数用于销毁所有创建的窗口,若需要指定销毁某一窗口,调用cv2.destroyWindow(window name),参数传递窗口名即可。

有一个特例(相对im.imshow自动创建窗口而言),你可以先创建一个窗口,之后在用它来载入显示图片。这种方式下,你可以指定是否窗口可以被调整大小。调用函数cv2.namedWindow(name,flag),默认情况下,flag是cv2.WINDOW_AUTOSIZE表示窗口是自动适应图片大小,若你希望可以随意调整窗口大小(在图片很大或是为窗口添加trackbar的时候会很有用),你可以将flag设置为cv2.WINDOW_NORMAL.

cv2.namedWindow('image', cv2.WINDOW_NORMAL)
cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

回写图片

使用cv2.imwrite()函数保存图片。

  • 第一个参数:保存的文件名(全路径文件名)
  • 第二个参数:图片对象
# 保存图片为PNG格式到当前工作目录
cv2.imwrite('messigray.png',img)

下列代码实现以下功能

  • 载入一副灰度图
  • 显示图片
  • 当按下’s’键时,保存图片,并退出
  • 当按下’ESC’时,不保存图片,直接退出
import numpy as np
import cv2

img = cv2.imread('messi5.jpg',0)
cv2.imshow('image',img)
k = cv2.waitKey(0)
if k == 27:         # wait for ESC key to exit
    cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
    cv2.imwrite('messigray.png',img)
    cv2.destroyAllWindows()

ord() 函数是 chr() 函数(对于8位的ASCII字符串)或 unichr() 函数(对于Unicode对象)的配对函数,它以一个字符(长度为1的字符串)作为参数,返回对应的 ASCII 数值,或者 Unicode 数值,如果所给的 Unicode 字符超出了你的 Python 定义范围,则会引发一个 TypeError 的异常。

官方文档中说,若是64位系统,需要将k = cv2.waitKey(0)修改为k = cv2.waitKey(0) & 0xFF,事实上,我的电脑是64位环境,上述代码任然有效,不知道是什么情况。


使用matplotlib

Matplotlib是一个python的绘图库,它提供了种类繁多的绘图方法,后续的文章中你会学习到的。此处,我们使用它进行图片的显示,你可以缩放图片,保存图片。

import numpy as np
import cv2
from matplotlib import pyplot as plt

img = cv2.imread('messi5.jpg',0)
plt.imshow(img, cmap = 'gray', interpolation = 'bicubic')
plt.xticks([]), plt.yticks([])  # 隐藏x轴和y轴的坐标轴
plt.show()

Matplotlib提供许多绘图选项可用,可以查阅Matplotlib的文档了解详情,之后我们用到再说。

Opencv加载彩色图像是以BGR模式的,而Matplotlib显示图片是以RGB模式的,所以如果以Opencv加载然后在Matplotlib中显示,彩色图片不能被正确地显示。

当然,你可以采用下面这种方式,转换图像通道,以进行正确的显示。

import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('messi4.jpg')
# 拆分三个通道
b,g,r = cv2.split(img)
# 按rgb顺序重组三个通道
img2 = cv2.merge([r,g,b])
# 显示原图像
plt.subplot(121)
plt.imshow(img)
# 显示转换后的图像
plt.subplot(122)
plt.imshow(img2) 
plt.show()

# 对比以下,用Opencv显示两个图像
cv2.imshow('bgr image',img)
cv2.imshow('rgb image',img2) 
cv2.waitKey(0)
cv2.destroyAllWindows()

这里写图片描述
这里写图片描述

当然若熟悉Numpy,你可以采用这样一种更简单的方式实现BGR到RGB的转换:img2 = img[:,:,::-1],同时,你也可以通过调用函数img2 = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)实现该功能

这里img[:,:,::-1]是python的切片语法,[start​: end: step],当start和end都不填时表示所有元素,然后step=-1,表示反转。

猜你喜欢

转载自blog.csdn.net/u013095718/article/details/80396419
今日推荐