3 个月前

ORBIT:面向可教学物体识别的真实世界少样本数据集

ORBIT:面向可教学物体识别的真实世界少样本数据集

摘要

过去十年中,物体识别技术取得了显著进展,但其仍主要依赖于每个物体类别大量高质量的训练样本。相比之下,仅凭少量样本即可学习新物体的能力,有望在机器人、用户个性化等众多领域带来深远影响。然而,当前多数少样本学习研究依赖于基准数据集,这些数据集缺乏真实应用场景中所面临的高度多样性。为弥合这一差距,我们提出了ORBIT数据集与基准测试,其源于为视障或低视力人群开发可教学物体识别器的真实世界应用需求。该数据集包含由视障或低视力用户使用手机录制的3,822段视频,涵盖486个不同物体。该基准测试模拟了真实、极具挑战性的识别任务,为研究在少样本、高变化条件下的鲁棒性提供了丰富的实验平台。我们设定了该基准的首个最先进性能,并表明仍有巨大的创新空间,未来有望推动包括视障人群辅助工具在内的多种真实世界视觉应用的发展。我们已将数据集公开发布于 https://doi.org/10.25383/city.14294597,基准测试代码开源地址为 https://github.com/microsoft/ORBIT-Dataset。

代码仓库

microsoft/ORBIT-Dataset
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
few-shot-image-classification-on-orbitFineTuner
Frame accuracy: 53.73
few-shot-image-classification-on-orbit-cleanMAML
Frame accuracy: 70.58

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ORBIT:面向可教学物体识别的真实世界少样本数据集 | 论文 | HyperAI超神经