ARCore之路-图像识别概述

版权声明:David Wang原创ARCore文章,仅供学习研究之用,不得用于任何商业目的,未经授权不得转载! https://blog.csdn.net/yolon3000/article/details/83421323

  图像识别是识别和检测数字图像或视频中的对象或特征的过程。图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的图形图像及真实物体信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。近年来,图像识别技术飞速发展,如人脸识别、手势识别、步态识别、车牌识别已经广泛应用到了日常生活中了,随着图像识别及处理技术的发展,可以预见人们的生活将越来越依赖图像识别技术。

Cookie

  图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的目标。这里所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有的本身特征而先将这些图像分类,然后通过各个类别所具有的特征将图像识别出来的,这是一种下意识的动作,很多时候我们没有意识到这一点。当看到一张图片时,我们的大脑会迅速感应到是否见过此图片或与其相似的图片。其实在“看到”与“感应到”的中间经历了一个迅速识别过程,这个识别的过程和搜索有些类似。在这个过程中,我们的大脑会根据存储记忆中已经分好的类别进行识别,查看是否有与该图像具有相同或类似特征的存储记忆,从而识别出是否见过该图像。计算机的图像识别技术也是如此,通过分类并提取重要特征而排除多余的信息来识别图像。计算机所提取出的这些特征有时会非常明显,有时又是很普通,这在很大的程度上影响了计算机识别的速率和准确性。在计算机的图像识别中,图像的内容通常是用图像特征进行描述。

一、图像识别技术的过程

  既然计算机的图像识别技术与人类的图像识别原理相同,那它们的过程也是大同小异的。图像识别技术的过程分以下几步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。

  • 图像采集 - 数字图像由一个或多个图像传感器产生,除了各种类型的光敏相机外,还包括距离传感器,雷达,超声波相机等。根据传感器的类型,得到的图像数据是普通的2D图像,3D体积或图像序列。
  • 预处理 - 在将计算机图像识别技术应用于图像数据以提取某些特定信息之前,通常需要处理数据以确保其满足特定的要求,为了减少后续算法的复杂度和提高效率,图像的预处理是必不可少的。其中背景分离是将图像区与背景分离,从而避免在没有有效信息的区域进行特征提取,加速后续处理的速度,提高图像特征提取和匹配的精度、图像增强的目的是改善图像质量,恢复其原来的结构、图像的二值化是将图像从灰度图像转换为二值图像、图像细化是把清晰但不均匀的二值图像转化成线宽仅为一个像素的点线图像。还包括:
    • 重新采样以确保图像坐标系正确。
    • 降噪以确保传感器噪声不会引入错误信息。
    • 对比度增强以确保可以检测到相关信息。
    • 缩放空间表示以在局部适当的比例下增强图像结构。
  • 特征提取 - 从图像数据中提取各种复杂程度的图像特征。简单的理解就是我们所研究的图像是各式各样的,如果要利用某种方法将它们区分开,就要通过这些图像所具有的本身特征来识别,而获取这些特征的过程就是特征抽取。在特征抽取中所得到的特征也许对此次识别并不都是有用的,这个时候就要提取有用的特征,这就是特征的选择。特征抽取和选择在图像识别过程中是非常关键的技术之一,也是图像识别的重点。目前,解决这类问题的最佳算法是基于卷积神经网络的。
  • 检测/分割 - 在处理的某个时刻,决定图像的哪个图像点或区域与进一步处理相关。其包括选择一组特定的兴趣点,对包含特定感兴趣对象的一个​​或多个图像区域的分割,将图像分割成前景、对象组、单个对象或背景对象部分。
  • 分类是通过一种识别规则将得到一种特征分类,将检测到的对象分类为不同的类别。
  • 分类决策是指在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。
  • 图像匹配-图像匹配是在图像预处理和特征提取的基础上,将当前输入的测试图像特征与事先保存的模板图像特征进行比对,通过它们之间的相似程度,判断这两幅图像是否一致。
Cookie

二、图像识别主流技术

(一)、模式识别

  模式识别是人工智能和信息科学的重要组成部分。模式识别是指对表示事物或现象的不同形式的信息做分析和处理从而得到一个对事物或现象做出描述、辨认和分类等的过程。计算机的图像识别技术就是模拟人类的图像识别过程。在图像识别的过程中进行模式识别是必不可少的。模式识别原本是人类的一项基本智能。但随着计算机的发展和人工智能的兴起,人类本身的模式识别已经满足不了生活的需要,于是人类就希望用计算机来代替或扩展人类的部分脑力劳动。这样计算机的模式识别就产生了。简单地说,模式识别就是对数据进行分类,它是一门与数学紧密结合的科学,其中所用的思想大部分是概率与统计。模式识别主要分为三种:统计模式识别、句法模式识别、模糊模式识别。

(二)、深度学习

  深度学习是机器学习中一种基于对数据进行表征学习的方法。一幅图像可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。基于卷积神经网络(Convolutional Neural Network,cnn)机器学习模型目前在图像识别领域发展尤为迅速。卷积网络是受生物过程启发,因为神经元之间的连接模式类似于动物视觉皮层的组织结构,单个皮层神经元只在视场的一个受限区域,即感受区,对刺激作出反卷积网络是受生物过程[4]启发的,因为神经元之间的连接模式类似于动物视觉皮层的组织结构。单个皮层神经元只在视场的一个受限区域,即感受区,对刺激作出反应,不同神经元的感受场部分重叠,从而覆盖整个视野,不同神经元的感受场部分重叠,从而覆盖整个视野。

Cookie

(三)、非线性降维的图像识别技术

  计算机的图像识别技术是一个异常高维的识别技术。不管图像本身的分辨率如何,其产生的数据经常是多维性的,这给计算机的识别带来了非常大的困难。想让计算机具有高效地识别能力,最直接有效的方法就是降维。降维分为线性降维和非线性降维。例如主成分分析(PCA)和线性奇异分析(LDA)等就是常见的线性降维方法,它们的特点是简单、易于理解。但是通过线性降维处理的是整体的数据集合,所求的是整个数据集合的最优低维投影。经过验证,这种线性的降维策略计算复杂度高而且占用相对较多的时间和空间,因此就产生了基于非线性降维的图像识别技术,它是一种极其有效的非线性特征提取方法。此技术可以发现图像的非线性结构而且可以在不破坏其本征结构的基础上对其进行降维,使计算机的图像识别在尽量低的维度上进行,这样就提高了识别速率。例如人脸图像识别系统所需的维数通常很高,其复杂度之高对计算机来说无疑是巨大的“灾难”。由于在高维度空间中人脸图像的不均匀分布,使得人类可以通过非线性降维技术来得到分布紧凑的人脸图像,从而提高人脸识别技术的高效性。

三、图像识别的主要应用

  图像识别应该极为广泛,从医学图像处理、工业应用、军事应用,到常见的二维码识别、车牌识别、人脸识别等。目前发展极快且前景广阔的应用领域之一是自主飞行器,包括潜水器、陆基车辆(带轮子、汽车或卡车的小型机器人)、飞行器和无人驾驶飞行器(UAV)。自主级别从完全自主(无人驾驶)车辆到计算机视觉系统在各种情况下支持驾驶员或飞行员的车辆。完全自动驾驶的车辆通常使用计算机视觉进行导航,即知道其所在位置,或绘制其环境地图(SLAM)和探测障碍物。
  并且,图像识别技术也在不断地成长,随着科技的不断进步,人类对图像识别技术的认识也会更加深刻。未来图像识别技术将会更加强大,更加智能地出现在我们的生活中,为人类社会的更多领域带来重大的应用。在21世纪这个信息化的时代,我们无法想象离开了图像识别技术以后我们的生活会变成什么样。图像识别技术是人类现在以及未来生活必不可少的一项技术。

参考文献

1、图像识别的原理、过程、应用前景 图像识别的原理、过程、应用前景
2、Computer vision Computer vision

猜你喜欢

转载自blog.csdn.net/yolon3000/article/details/83421323