
摘要
在本工作中,我们介绍了在 ORBIT 少样本视频目标识别挑战赛 2022 中的获奖解决方案。该方法在 ProtoNet 基线模型的基础上,通过引入三种有效技术显著提升了性能,这三种技术分别为:嵌入适配(embedding adaptation)、均匀视频片段采样器(uniform video clip sampler)以及无效帧检测(invalid frame detection)。此外,我们对官方代码库进行了重构与重实现,以增强模块化设计、兼容性及整体性能。我们的实现显著加快了训练与测试阶段的数据加载速度。
代码仓库
guliisgreat/orbit-2022-winner-method
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| few-shot-image-classification-on-orbit | ProtoNetsVideo | Frame accuracy: 71.69 |