摘要：

在本文提出了用于多人姿态估计的人内和人际关系网络（I^2R-Net）。它涉及到两个基本的模块。首先，人内关系模块针对一个人进行操作，旨在捕获人内的依赖关系。其次，人际关系模块考虑了多个实例之间的关系，并专注于捕获人间交互。通过降低特征图的分辨率，人际关系模块可以设计得非常轻量级，但也可以学习有用的关系信息，以显著提高人内关系模块的性能。模型在COCO、CrowdPose和OCHuman数据集上进行了广泛的实验。结果表明，所提出的模型超过了所有最先进的方法。

一、前言

二维多人姿态估计（MPPE）的目的是检测和定位所有出现在给定图像中的人的人类关键点。由于人体姿态提供了丰富的结构和运动信息，MPPE在人类活动理解、人物交互、化身动画等领域引起了广泛的关注。目前的MPPE方法可以分为自上而下和自下而上两种方式。

尽管上述方法在MPPE中取得了很好的性能，但由于重叠、自遮挡和各种外观和姿态，在拥挤的场景中产生的效果较差。自上而下的方法分别对待每个人，忽略了人与人之间相互作用的信息线索。另一方面，自下而上的方法联合检测图像中所有人的关节，可能将人之间的关节关联起来，但人之间的关系是模糊和不可知的。

最近，一些先驱通过解耦来解决上述挑战或者在一个人身上融合多种可能的姿势。然而，这些方法仍然没有完全考虑到多重-人的相关性，留下这些重要的相互作用未被探索。

自顶向下的方法一个接一个地进行估计，而不考虑实例之间的关系。虽然自底向上的方法可以

论文笔记——I^2R-Net

摘要：

一、前言

猜你喜欢