6 个月前

多模态表征

Xi Peng Jiancheng Lv Xinyan Xiao guocheng niu Peng Hu Zhenyu Huang

摘要

本文研究了一种针对噪声标签的新学习范式——噪声对应关系（Noisy Correspondence, NC）。与以往广泛研究的类别标注错误型噪声标签不同，NC 指的是两个数据样本之间对应关系的错误，即虚假正例对（false positive pairs）。尽管这类错误在从互联网上获取的数据中尤为常见，但大多数现有工作却对此类问题缺乏关注。本文以跨模态检索为例，提出一种名为“带噪声对应关系学习”（Learning with Noisy Correspondence, LNC）的新方法。简而言之，LNC 首先从原始数据中粗略划分出干净样本子集与噪声样本子集，随后利用一种新颖的自适应预测函数对虚假正例对进行修正；最后，通过引入一种具有软边距的新型三元组损失函数，增强跨模态检索模型对噪声对应关系的鲁棒性。为验证所提出 LNC 方法的有效性，我们在图像-文本与视频-文本检索任务的六个基准数据集上进行了实验。实验结果不仅证明了 LNC 方法的优越性能，还揭示了在标准模型训练范式、预训练与微调范式下，显式解决噪声对应关系问题的必要性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

多模态表征

Xi Peng Jiancheng Lv Xinyan Xiao guocheng niu Peng Hu Zhenyu Huang

摘要

本文研究了一种针对噪声标签的新学习范式——噪声对应关系（Noisy Correspondence, NC）。与以往广泛研究的类别标注错误型噪声标签不同，NC 指的是两个数据样本之间对应关系的错误，即虚假正例对（false positive pairs）。尽管这类错误在从互联网上获取的数据中尤为常见，但大多数现有工作却对此类问题缺乏关注。本文以跨模态检索为例，提出一种名为“带噪声对应关系学习”（Learning with Noisy Correspondence, LNC）的新方法。简而言之，LNC 首先从原始数据中粗略划分出干净样本子集与噪声样本子集，随后利用一种新颖的自适应预测函数对虚假正例对进行修正；最后，通过引入一种具有软边距的新型三元组损失函数，增强跨模态检索模型对噪声对应关系的鲁棒性。为验证所提出 LNC 方法的有效性，我们在图像-文本与视频-文本检索任务的六个基准数据集上进行了实验。实验结果不仅证明了 LNC 方法的优越性能，还揭示了在标准模型训练范式、预训练与微调范式下，显式解决噪声对应关系问题的必要性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

基于噪声对应关系的学习 | 论文 | HyperAI超神经