4 个月前

置换不变关系网络用于多人3D姿态估计

置换不变关系网络用于多人3D姿态估计

摘要

从单个RGB图像中恢复多人3D姿态是一个严重条件不良的问题,这是由于固有的2D-3D深度模糊性、人际遮挡以及身体截断所导致的。为了解决这些问题,最近的研究通过同时推理不同个体的姿态取得了令人鼓舞的结果。然而,在大多数情况下,这种推理仅考虑了两两之间的人际交互,从而限制了对场景的整体表示能力,无法捕捉远距离交互。尽管有些方法通过联合处理场景中的所有个体来解决这一问题,但它们需要将某一个体定义为参考对象并预先确定个体顺序,这使得结果对该选择非常敏感。在本文中,我们克服了上述两个限制,并提出了一种多人3D姿态估计方法,该方法能够独立于输入顺序捕捉远距离交互。为此,我们构建了一个类似残差的置换不变网络,该网络能够成功地优化由现成检测器估计出的可能受损的初始3D姿态。残差函数通过Set Transformer模块学习得到,这些模块可以建模所有初始姿态之间的交互,无论其顺序或数量如何。详尽的评估表明,我们的方法能够在很大程度上提升初始估计的3D姿态性能,在标准化基准测试中达到了最先进的水平。此外,所提出的模块在计算上具有高效性,并且可以作为任何3D姿态检测器在多人场景中的即插即用补充模块。

基准测试

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供