
摘要
社会关系(如朋友、情侣等)构成了我们日常生活中社交网络的基础。自动解释这些关系对于智能系统深入理解人类行为并在社交层面更好地与人们互动具有巨大的潜力。人类在解读群体内的社会关系时,不仅依赖于个体本身,还受到周围情境信息与这些社会关系之间相互作用的显著影响。然而,以往的研究大多忽略了这些额外的线索。我们发现,通过一种新颖的结构化知识图谱,并结合适当的消息传递和注意力机制,可以有效建模这两种因素之间的相互作用。这种结构化的知识可以高效地集成到深度神经网络架构中,以促进社会关系的理解。具体而言,通过一个端到端可训练的图推理模型(Graph Reasoning Model, GRM),学习了一种传播机制,该机制可以通过图谱将节点消息传递给其他节点,从而探索目标人物与周围情境对象之间的互动。同时,引入了图注意力机制,明确推理出具有区分性的对象以提升识别效果。在公共基准数据集上的大量实验表明,我们的方法优于现有的领先竞争对手。
代码仓库
HCPLab-SYSU/SR
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| visual-social-relationship-recognition-on | GRM | mAP: 68.7 mAP (Coarse): 82.8 |
| visual-social-relationship-recognition-on-1 | GRM | Accuracy: 62.3 |