作为一种新的分类平台,深度学习最近已受到研究人员的越来越多的关注,并已成功地应用于许多领域。
不过在某些领域如生物信息,由于其数据获取和数据标注都需要进行大量的临床试验,因此很难构建大规模带有标注的高质量数据集,从而限制了它的发展。
为此,有人提出了迁移学习,这放松了数据获取的假设:只要求训练数据必须独立且与测试数据相同分布(i.i.d.),这促使我们可以使用迁移学习来解决训练数据不足的问题。
迁移学习就像在讲诉一个站在巨人肩膀的故事。随着越来越多的深度学习应用场景的出现,人们不可避免会去想,如何利用已训练的模型去完成相类似的任务,毕竟重新训练一个优秀的模型需要耗费大量的时间和算力,而在前人的模型进行改进,进而举一反三无疑是最好的办法。笔者将在这章给大家介绍迁移学习与计算机视觉的故事。
7.1 计算机视觉
计算机视觉的任务是识别和理解图像或者视频中的内容。
如今,互联网上超过70%的数据是图像或者视频,全世界的摄像头数目已超过人口数,每天有数以亿计小时的视频数据生成。
因此,我们需要自动化的计算机视觉技术才能处理如此大的数据量,这也是近年来计算机视觉能够蓬勃发展的原因。接下来,笔者将介绍计算机视觉的4个基础任务。
7.1.1 图像分类(image classification)
给定一张输入图像,图像分类任务只要判断出该图像的类别即可。
7.1.2 目标检测(object detection)
目标检测是将图像中出现的不同类别的目标识别出来,如图 7.1所示。
图 7.1 目标检测示意图
7.1.3 语义分割(semantic segmentation)
语义分割是目标检测更进阶的任务,目标检测只需要圈出每个目标的包围盒,语义分割则需要判断图像中哪些像素对应于哪些目标,也就是对图像中的每一个像素进行分类,如图 7.2所示。
图 7.2 语义分割示意图
7.1.4 实例分割(instance segmentation)
实例分割则是目标检测与语义分割的综合任务。语义分割不区分属于相同类别的不同实例。如图X所示,当图像中有两个人时,语义分割会将所有人的像素预测为“person”这个类别。实例分割则需要区分出“person”这个类别下每一个人的实例,如图 7.3所示。
图 7.3 实例分割示意图
下一期,我们将详细介绍
迁移学习、目标检测、语义分割、实例分割的具体原理
敬请期待~
关注我的微信公众号~不定期更新相关专业知识~
内容 |阿力阿哩哩
编辑 | 阿璃
点个“在看”,作者高产似那啥~