计算机视觉头歌实验

企业开发 2024-11-05 00:02:23 阅读次数: 0

实验1：图像的阈值与平滑

任务描述

本关任务：理解图像的色彩模式，掌握图像阈值分割的基本原理并对图像进行阈值分割处理。

相关知识

图像阈值化分割是一种最常用，同时也是最简单的图像分割方法，特别适用于处理目标和背景占据不同灰度级范围的图像。

为了完成本关任务，你需要掌握：

图像阈值分割的基本原理；
对图像进行阈值分割。

图像色彩模式转换

在生活中，大多数看到的彩色图片都是 RGB 类型。RGB 色彩模式是工业界的一种颜色标准，是通过对红 ( R )、绿 ( G )、蓝 ( B )三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色。

但是在执行不同的图像处理任务时，也需要用到灰度图、HSV 、YUV 等不同的颜色制式。OpenCV 提供了cvtColor()函数来实现这些图像色彩模式的转换。函数表达式如下所示：

st = cv2.cvtColor(src, code)

函数中各参数含义为：

src：源图片的地址；
code：转换方式。该参数包含了很多的颜色空间转换类型，例如将颜色空间 BGR 转化为 RGB 、RGB 转化为 HSV 空间等。所有的转换方式在 enum ColorConversionCodes 中定义，具体参数枚举类型请参阅 API 文档。

该代码的作用是把图片img转换为经过图像色彩模式处理的图片st。

本次任务要用到的转换方式是COLOR_BGR2GRAY，它表示从 BGR 彩色图像转换为 GRAY 灰度图像。举个例子：

img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

该代码的作用是把img转化为灰度图img_gray。如图1所示，该代码把左侧彩色的熊的图片转化为右侧的灰度图。

扫描二维码关注公众号，回复： 17502425 查看本文章

图 1 彩色图像（左）与其灰度图（右）

注意：

在 OpenCV 2.x 时，颜色空间转换code用的宏定义是CV_前缀开头；而在 OpenCV 3.x 版本，其颜色空间转换code宏定义更改为COLOR_开头;
彩色图像与灰度图像的转换是不可逆的。

图像阈值分割

图像阈值分割是最简单的图像分割方法。为了从一副图像中提取出需要的部分，应该用图像中的每一个像素点的灰度值与选取的阈值进行比较，并作出相应的判断。

注意：阈值的选取依赖于具体的问题。即：物体在不同的图像中有可能会有不同的灰度值。

图像阈值化分割不仅可以极大的压缩数据量，而且也大大简化了分析和处理步骤。因此在很多情况下，图像阈值化分割是进行图像分析、特征提取与模式识别之前必要的图像预处理过程。

例如：从一副图像中利用阈值分割出需要的物体部分（当然这里的物体可以是一部分或者整体）。这样的图像分割方法是基于图像中物体与背景之间的灰度差异，而且此分割属于像素级的分割。

一旦找到了需要分割的物体的像素点，就可以对这些像素点设定一些特定的值来表示。

例如：可以将该物体的像素点的灰度值设定为：0（黑色），其他的像素点的灰度值为：255（白色）。当然像素点的灰度值可以任意，但最好设定的两种颜色对比度较强，方便观察结果。

在 OpenCV 中，cv2.threshold()可以用来进行图像阈值分割处理。它的函数表达式为：

ret, dst=cv2.threshold(src，thresh，maxval，type)

其中它的输入参数有：

src：输入图像，只能输入单通道图像，通常来说为灰度图；
thresh：阈值；
maxval：最大值。当像素值超过了阈值均设置为该值；
type：操作的类型，就是怎么处理阈值。该参数包含八种类型的阈值化操作。列举以下五种常用的类型：
- cv2.THRESH_BINARY：超过阈值部分取maxval（最大值），否则取0；
- cV2.THRESH_BINARY_INV：超过阈值部分取0，否则取maxval（最大值）。它与cv2.THRESH_BINARY是互为反转的方法；
- cV2.THRESH_TRUNC：大于阈值部分设为阈值，否则不变。即截断阈值；
- cV2.THRESH_TOZERO：大于阈值部分不改变，否则设为0；
- cV2.THRESH_TOZERO_INV：大于阈值部分为0，否则不变。它与THRESH_TOZERO互为反转。

threshold()函数有两个返回值，其中第二个返回值dst是处理后的灰度图。当指定了阈值参数thresh，第一个返回值ret就是指定的thresh。

例如，图2中原始图片为 Original Image。使用以上五种阈值化操作类型处理它，可以得到相应的处理后的图片如图2中的 BINARY ~ TOZERO_INV，其中阈值为150，最大值为255。

从图2中可以很明显的观察到阈值操作是对图像的灰度图进行的操作，通过亮度来分离背景与物体。并且可以观察到互为反转方法，例如 BINARY 与 BINARY_INV ，对背景与物体的亮度处理相反。

图 2 不同 type 类型下的阈值分割得到的图像

编程要求

根据提示，在右侧编辑器补充 Begin-End 区间代码，实现对给定图片实现阈值分割图像的任务。具体要求如下：

使用 OpenCV 提供的函数读取路径下的图片cat.jpg；
交换通道为RGB；
把读入的图片转化为灰度图；
分别对灰度图进行阈值化操作： THRESH_BINARY、THRESH_BINARY_INV、THRESH_TRUNC、THRESH_TOZERO、THRESH_TOZERO_INV。阈值为150，最大值为255，并且将返回的灰度图分别命名为thresh1 ~ thresh5。

上代码：

import cv2
import matplotlib.pyplot as plt
def thd():
    filepath='/data/workspace/myshixun/task1/'
    # 请根据左侧编程要求，完成图像阈值化操作：
    ########## Begin ##########
    img = cv2.imread(filepath+'cat.jpg')
    #先将RGB通道转换成BGR通道
    img = cv2.cvtColor(img,cv2.COLOR_RGB2BGR)
    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    ret,thresh1 = cv2.threshold(img_gray,150,255,cv2.THRESH_BINARY)
    ret,thresh2 = cv2.threshold(img_gray,150,255,cv2.THRESH_BINARY_INV)
    ret,thresh3 = cv2.threshold(img_gray,150,255,cv2.THRESH_TRUNC)
    ret,thresh4 = cv2.threshold(img_gray,150,255,cv2.THRESH_TOZERO)
    ret,thresh5 = cv2.threshold(img_gray,150,255,cv2.THRESH_TOZERO_INV)

    ########## End ##########

    # 作图并保存到指定路径
    titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
    images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
    for i in range(6):
        plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
        plt.title(titles[i])
        plt.xticks([]), plt.yticks([])
    plt.savefig(filepath+'out/threthold.png')

实验2：图像的平滑

任务描述

本关任务：理解图像平滑的基本原理，掌握图像平滑的常用方法并对图像进行几种典型的图像平滑操作。

编程要求

根据提示，在右侧编辑器补充 Begin-End 区间的代码，实现图像的平滑处理。具体要求如下：

读取filepath下的pic.png作为待处理图像；
更改图像通道为RGB通道顺序；
分别使用均值滤波、高斯滤波、方框滤波、中值滤波对图像进行滤波操作。返回的图像变量请分别命名为res1 ~ res4。其中所有的滤波器核大小为5x5；高斯滤波的sigmaX、sigmaY由ksize计算；方框滤波输出与原始图像一致，不使用归一化处理。

上代码：

import cv2
import matplotlib.pyplot as plt

# 使用图像平滑处理带噪声的图片
def flt():
    filepath = '/data/workspace/myshixun/task2/'
    # 请根据左侧编程要求，完成图像平滑操作：
    ########## Begin ##########
    img = cv2.imread(filepath+'pic.png')
    #注意按照要求转换颜色通道
    img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
    res1 = cv2.blur(img,(5,5))
    res2 = cv2.GaussianBlur(img,(5,5),0,0)
    res3 = cv2.boxFilter(img,-1,(5,5),False)
    res4 = cv2.medianBlur(img,5)
   
    ########## End ##########

    # 作图并保存到指定路径
    titles = ['Blur', 'GaussianBlur', 'boxFilter', 'medianBlur']
    images = [res1, res2, res3, res4]
    # 分别画出四个子图，并保存为filter.png
    for i in range(4):
        plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
        plt.title(titles[i])
        plt.xticks([]), plt.yticks([])
    plt.savefig(filepath+'out/filter.png')

猜你喜欢

转载自blog.csdn.net/c_grass_c/article/details/134251608

计算机视觉头歌实验

头歌计算机组成原理实验通关

Logisim 头歌汉字字库存储芯片扩展实验图解及代码（计算机组成原理）

文档矫正（计算机视觉实验）

计算机视觉实验1

计算机视觉实验三

计算机视觉

计算机视觉~~~

头歌计算机算法设计与分析：随机化算法

Logisim 头歌偶校验编码设计图解及代码（计算机组成原理）

头歌计算机网络 DHCP 服务器配置答案无解析

计算机视觉——Harris角点检测（课堂实验）

计算机视觉实验室(China)

SIFT地理特征匹配——计算机视觉实验二

计算机视觉实验的公开数据集

山大计算机视觉实验3

山大计算机视觉实验4

基于模板匹配的螺母检测（计算机视觉实验）

计算机视觉 YOLOv5_3.1实验记录

计算机视觉实验：人脸识别系统设计

计算机视觉实验：图像处理综合-路沿检测

计算机视觉实验：图像增强应用实践

计算机视觉——实验一：图像直方图均衡

【计算机视觉】基于OpenCV计算机视觉的摄像头测距技术设计与实现

计算机视觉会议计算机视觉刊物

【计算机视觉】几个计算机视觉库

【计算机视觉】一、计算机视觉概述

计算机视觉整理

计算机视觉（一）

计算机视觉大神

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)