4 个月前

开放词汇属性检测

开放词汇属性检测

摘要

视觉-语言建模已经实现了开放词汇任务,其中可以使用任何文本提示以零样本的方式进行预测查询。现有的开放词汇任务主要集中在对象类别上,而由于缺乏可靠的属性聚焦评估基准,对对象属性的研究相对有限。本文介绍了开放词汇属性检测(OVAD)任务及其相应的OVAD基准。该新任务和基准的目的是探究视觉-语言模型所学习到的对象级别的属性信息。为此,我们创建了一个干净且密集注释的测试集,涵盖了MS COCO数据集中80个对象类别的117个属性类别。该测试集包括正向和负向注释,从而支持开放词汇评估。总体而言,该基准包含140万个注释。作为参考,我们提供了一种开放词汇属性检测的初步基线方法。此外,通过研究几种基础模型的属性检测性能,我们展示了该基准的价值。项目页面:https://ovad-benchmark.github.io

代码仓库

基准测试

基准方法指标
open-vocabulary-attribute-detection-on-ovadOVAD-Baseline (ResNet50)
mean average precision: 18.8
open-vocabulary-attribute-detection-on-ovad-1OVAD-Baseline-Box
mean average precision: 21.4
open-vocabulary-object-detection-on-mscocoOVAD-Baseline
AP 0.5: 30.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
开放词汇属性检测 | 论文 | HyperAI超神经