
摘要
我们提出了一种新的无监督对象中心表示学习及多对象检测与分割架构,该架构采用平移等变注意力机制来预测场景中对象的坐标,并为每个对象关联一个特征向量。变压器编码器负责处理遮挡和冗余检测问题,而卷积自动编码器则负责背景重建。实验结果表明,该架构在复杂的合成基准测试中显著优于现有最先进方法。
代码仓库
BrunoSauvalle/AST
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| unsupervised-object-segmentation-on | AST | ARI-FG: 0.82 |
| unsupervised-object-segmentation-on-1 | AST | ARI-FG: 0.87 |
| unsupervised-object-segmentation-on-clevrtex | AST | MSE: 167± 1 mIoU: 66.62± 0.80 |
| unsupervised-object-segmentation-on-clevrtex | AST-Seg-B3-CT | MSE: 139±7 mIoU: 79.58±0.54 |