
摘要
实例感知任务(如目标检测、实例分割、姿态估计、计数等)在视觉模型的工业应用中发挥着关键作用。由于监督学习方法面临高昂的标注成本,因此亟需能够从有限标注样本中高效学习的少样本学习方法。现有的少样本学习方法主要局限于少数特定任务,这可能源于设计一种能够以统一方式表征多样化任务的通用模型所面临的挑战。本文提出UniFS——一种通用的少样本实例感知模型,通过将多种实例感知任务重新建模为动态点表示学习框架,实现了对广泛任务的统一建模。此外,我们提出了结构感知点学习(Structure-Aware Point Learning, SAPL),以挖掘点之间的高阶结构关系,进一步提升表示学习能力。我们的方法对任务假设极少,却在性能上达到了与高度专业化且经过充分优化的专用模型相媲美的水平。代码与数据已公开,获取地址为:https://github.com/jin-s13/UniFS。
代码仓库
jin-s13/unifs
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| few-shot-object-detection-on-ms-coco-1-shot | UniFS | AP: 12.7 |
| few-shot-object-detection-on-ms-coco-5-shot | UniFS | AP: 18.2 |