迁移学习与计算机视觉

作为一种新的分类平台，深度学习最近已受到研究人员的越来越多的关注，并已成功地应用于许多领域。

不过在某些领域如生物信息，由于其数据获取和数据标注都需要进行大量的临床试验，因此很难构建大规模带有标注的高质量数据集，从而限制了它的发展。

为此，有人提出了迁移学习，这放松了数据获取的假设：只要求训练数据必须独立且与测试数据相同分布（i.i.d.），这促使我们可以使用迁移学习来解决训练数据不足的问题。

迁移学习就像在讲诉一个站在巨人肩膀的故事。随着越来越多的深度学习应用场景的出现，人们不可避免会去想，如何利用已训练的模型去完成相类似的任务，毕竟重新训练一个优秀的模型需要耗费大量的时间和算力，而在前人的模型进行改进，进而举一反三无疑是最好的办法。笔者将在这章给大家介绍迁移学习与计算机视觉的故事。

7.1 计算机视觉

计算机视觉的任务是识别和理解图像或者视频中的内容。

如今，互联网上超过70%的数据是图像或者视频，全世界的摄像头数目已超过人口数，每天有数以亿计小时的视频数据生成。

因此，我们需要自动化的计算机视觉技术才能处理如此大的数据量，这也是近年来计算机视觉能够蓬勃发展的原因。接下来，笔者将介绍计算机视觉的4个基础任务。

7.1.1 图像分类(image classification)

给定一张输入图像，图像分类任务只要判断出该图像的类别即可。

7.1.2 目标检测(object detection)

目标检测是将图像中出现的不同类别的目标识别出来，如图 7.1所示。

图 7.1 目标检测示意图

7.1.3 语义分割(semantic segmentation)

语义分割是目标检测更进阶的任务，目标检测只需要圈出每个目标的包围盒，语义分割则需要判断图像中哪些像素对应于哪些目标，也就是对图像中的每一个像素进行分类，如图 7.2所示。

图 7.2 语义分割示意图

7.1.4 实例分割(instance segmentation)

实例分割则是目标检测与语义分割的综合任务。语义分割不区分属于相同类别的不同实例。如图X所示，当图像中有两个人时，语义分割会将所有人的像素预测为“person”这个类别。实例分割则需要区分出“person”这个类别下每一个人的实例，如图 7.3所示。

图 7.3 实例分割示意图

下一期，我们将详细介绍

迁移学习、目标检测、语义分割、实例分割的具体原理

敬请期待~

关注我的微信公众号~不定期更新相关专业知识~

内容 |阿力阿哩哩

编辑 | 阿璃

点个“在看”，作者高产似那啥~

发布了76 篇原创文章 · 获赞 5 · 访问量 6248

私信关注