迁移学习与计算机视觉

作为一种新的分类平台,深度学习最近已受到研究人员的越来越多的关注,并已成功地应用于许多领域。

不过在某些领域如生物信息,由于其数据获取和数据标注都需要进行大量的临床试验,因此很难构建大规模带有标注的高质量数据集,从而限制了它的发展。

为此,有人提出了迁移学习,这放松了数据获取的假设:只要求训练数据必须独立且与测试数据相同分布(i.i.d.),这促使我们可以使用迁移学习来解决训练数据不足的问题。

迁移学习就像在讲诉一个站在巨人肩膀的故事。随着越来越多的深度学习应用场景的出现,人们不可避免会去想,如何利用已训练的模型去完成相类似的任务,毕竟重新训练一个优秀的模型需要耗费大量的时间和算力,而在前人的模型进行改进,进而举一反三无疑是最好的办法。笔者将在这章给大家介绍迁移学习与计算机视觉的故事。

7.1 计算机视觉

计算机视觉的任务是识别和理解图像或者视频中的内容。

如今,互联网上超过70%的数据是图像或者视频,全世界的摄像头数目已超过人口数,每天有数以亿计小时的视频数据生成。

因此,我们需要自动化的计算机视觉技术才能处理如此大的数据量,这也是近年来计算机视觉能够蓬勃发展的原因。接下来,笔者将介绍计算机视觉的4个基础任务。

7.1.1 图像分类(image classification)

给定一张输入图像,图像分类任务只要判断出该图像的类别即可。

7.1.2 目标检测(object detection)

目标检测是将图像中出现的不同类别的目标识别出来,如图 7.1所示。

图 7.1 目标检测示意图

7.1.3 语义分割(semantic segmentation)

语义分割是目标检测更进阶的任务,目标检测只需要圈出每个目标的包围盒,语义分割则需要判断图像中哪些像素对应于哪些目标,也就是对图像中的每一个像素进行分类,如图 7.2所示。

图 7.2 语义分割示意图

                                     

7.1.4 实例分割(instance segmentation)

实例分割则是目标检测与语义分割的综合任务。语义分割不区分属于相同类别的不同实例。如图X所示,当图像中有两个人时,语义分割会将所有人的像素预测为“person”这个类别。实例分割则需要区分出“person”这个类别下每一个人的实例,如图 7.3所示。

图 7.3 实例分割示意图

下一期,我们将详细介绍

迁移学习、目标检测、语义分割、实例分割的具体原理

敬请期待~

关注我的微信公众号~不定期更新相关专业知识~

内容 |阿力阿哩哩 

编辑 | 阿璃 

点个“在看”,作者高产似那啥~

发布了76 篇原创文章 · 获赞 5 · 访问量 6248

猜你喜欢

转载自blog.csdn.net/Chile_Wang/article/details/104013194
今日推荐