人脸识别、文字识别背后的方法,以及研究的热点和难点

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/duozhishidai/article/details/86766214

 

模式识别是什么?

  作为人工智能的一个重要方向,模式识别的主要任务是模拟人的感知能力,如通过视觉和听觉信息去识别理解环境,又被称为“机器感知”或“智能感知”。

  人们在观察事物或现象的时候,常常要寻找它与其他事物或现象的不同之处,并根据一定目的把相似、但又细节不同的事物或现象组成一类。字符识别就是一个典型的例子,如数字“4”可以有各种写法,但都属于同一类别。人脑具有很强的模式识别和推广能力,即使对于某种不同写法的“4”,以前虽未见过,也能把它分到“4”所属的这一类别。人脑的这种对模式(事物、现象等)进行归类和分类的能力,就是模式识别,也就是感知能力。

  随着20世纪40年代电子计算机出现,50年代人工智能兴起,模式识别在20世纪60年代初迅速发展成为一门新学科。21世纪以来,模式识别又逐渐与深度学习融合。近年来,深度学习和大数据的出现推动了模式识别的快速发展。

  模式识别是一个智能任务,是人工智能的一种形式。机器学习,包括深度学习是模式识别背后的基本方法,通过学习(训练)使机器具备识别模式的能力。当前,用深度学习的方法来实现模式识别,能更好的解决问题。

  深度学习作为机器学习的一种,是对生物神经网络结构和信息处理机制的简单模拟。人工神经网络早在上世纪40年代就有人研究,50年代和80年代都曾产生较大的影响。近年来,随着计算能力的提升,可以训练层数较多的神经网络(称为深度神经网络)来提升数据拟合和识别能力,有的甚至达到了1000多层。深度学习一般就是指利用深度神经网络来进行学习。

  复杂条件下,人脸识别的正确率不到50%

  得益于深度学习,目前人脸识别和文字识别都是人工智能领域应用比较成功的方向,可以算是模式识别借助深度学习形成的主要研究成果之一。

  目前人脸识别、文字识别虽然已应用得较为广泛,但还不能算“应用得很好”。人脸识别目前应用得比较成熟的是门禁、通关等领域,原因在于被识别的对象能主动配合,距离摄像头较近,能拍摄到比较清楚的图像。很多厂商在用户配合、光照可控的场景下人脸识别正确率能达到99%以上。但在更加复杂的情况下,如在室外光照不均、距离远、人脸视角多变情况下,用监控摄像头进行人脸识别,识别正确率就会明显降低。

  目前在计算机前端加入AI模块,只能起辅助作用,复杂条件下的人脸识别依旧难以达到成熟应用的程度。刘成林表示,室外自然光照条件下,“人脸识别正确率还达不到50%”。

  文字识别领域也是如此。文字识别目前主要应用在书籍和报纸等的数字化上。报纸、金融机构、保险机构以及快递行业的的大量单据,都需要电子化后才能方便检索、管理和进行大数据分析。司法界推行智能法务,办案的文书(有印刷体,也有手写体)需要电子化。医院的病例、教育领域的作业题、考试答卷等,也都有很大的电子化需求。

  同人脸识别一样,图像清晰度和光照等问题也是文字识别的一大难点。平板扫描仪由于光照均匀,对纸质材料扫描得到的图像清晰度高,文字识别率较高。而拍照图片的识别率则会降低,室外自然场景图片中的文字检测和识别更是当今研究的热点和难点问题。

      人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,有兴趣的朋友,可以查阅多智时代,在此为你推荐几篇优质好文:

1.人工智能时代,AI人才都有哪些特征?

http://www.duozhishidai.com/article-1792-1.html

2.大数据携手人工智能,高校人才培养面临新挑战

http://www.duozhishidai.com/article-7555-1.html

3.人工智能,机器学习和深度学习之间,主要有什么差异

http://www.duozhishidai.com/article-15858-1.html

猜你喜欢

转载自blog.csdn.net/duozhishidai/article/details/86766214