三、计算机视觉_02计算机视觉领域的四大基本任务

0、前言

计算机视觉(Computer Vision,简称CV)是人工智能领域的一个重要分支,它是一个跨学科的领域,涉及计算机科学、人工智能、机器学习、图像处理、神经科学等多个学科的知识

计算机视觉使用计算机技术来模拟人类视觉系统的功能,使计算机能够从图像或多维数据中提取信息、识别对象/场景/活动,其目标是使计算机能够像人类一样“看”和“理解”视觉世界,其应用非常广泛,包括:

  • 自动驾驶汽车:使用视觉系统来识别道路标志、行人、其他车辆等
  • 医疗成像:辅助诊断,如肿瘤检测、骨折识别等
  • 安全监控:人脸识别、异常行为检测等
  • 工业自动化:质量控制、机器人导航等
  • 增强现实和虚拟现实:提供沉浸式体验,通过视觉技术增强现实世界
  • 智能手机应用:如面部识别解锁、图像搜索等

计算机视觉通常包括图像分类、目标定位、目标检测和图像分割这四大基本任务,它们是构建更复杂视觉系统的基础,其他的关键任务大多也是在这四大基本任务的基础上延伸开来的‌

1、图像分类(Image Classification)

1.1 概念

分类任务‌解决的是“是什么?”的问题,即:给定一张图片或一段视频,判断其中包含什么类别的目标,通过对图像的特征进行提取和分析,然后将图像分配到特定的类别(例如,识别一张图片中的物体是猫还是狗‌)

输入: 一张图像 输出: 每个类别的概率 策略: 选择最高概率即可(贪心解码思想)

猜你喜欢

转载自blog.csdn.net/weixin_43767064/article/details/143786341
今日推荐