7 个月前

计算机视觉

Zeynep Akata* Scott Reed† Daniel Walter† Honglak Lee† Bernt Schiele*

摘要

近年来，随着大规模图像数据集的可用，图像分类技术取得了显著进展。然而，细粒度分类仍然是一个主要挑战，因为大量细粒度类别需要高昂的标注成本。本项目表明，即使没有标记的训练数据，也可以在这些类别上实现令人信服的分类性能。通过给定的图像和类别嵌入（embeddings），我们学习了一个兼容性函数，使得匹配的嵌入得分高于不匹配的嵌入；零样本图像分类的过程是找到具有最高联合兼容性得分的标签。我们使用最先进的图像特征，并专注于不同的监督属性和非监督输出嵌入（output embeddings），这些输出嵌入要么从层次结构中派生，要么从未标记的文本语料库中学习得到。我们在“带属性的动物”（Animals with Attributes）和“加州理工-UCSD鸟类”（Caltech-UCSD Birds）数据集上建立了显著改进的新基准。最令人鼓舞的是，我们证明了完全非监督的输出嵌入（从维基百科学习并用细粒度文本改进）可以取得令人信服的结果，甚至超过了之前的监督方法的最佳水平。通过结合不同的输出嵌入，我们进一步提高了结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

计算机视觉

Zeynep Akata* Scott Reed† Daniel Walter† Honglak Lee† Bernt Schiele*

摘要

近年来，随着大规模图像数据集的可用，图像分类技术取得了显著进展。然而，细粒度分类仍然是一个主要挑战，因为大量细粒度类别需要高昂的标注成本。本项目表明，即使没有标记的训练数据，也可以在这些类别上实现令人信服的分类性能。通过给定的图像和类别嵌入（embeddings），我们学习了一个兼容性函数，使得匹配的嵌入得分高于不匹配的嵌入；零样本图像分类的过程是找到具有最高联合兼容性得分的标签。我们使用最先进的图像特征，并专注于不同的监督属性和非监督输出嵌入（output embeddings），这些输出嵌入要么从层次结构中派生，要么从未标记的文本语料库中学习得到。我们在“带属性的动物”（Animals with Attributes）和“加州理工-UCSD鸟类”（Caltech-UCSD Birds）数据集上建立了显著改进的新基准。最令人鼓舞的是，我们证明了完全非监督的输出嵌入（从维基百科学习并用细粒度文本改进）可以取得令人信服的结果，甚至超过了之前的监督方法的最佳水平。通过结合不同的输出嵌入，我们进一步提高了结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供