7 个月前

卷积神经网络

计算机视觉

Bin-Bin Gao Chao Xing Chen-Wei Xie Jianxin Wu, Member, IEEE Xin Geng, Member, IEEE

摘要

卷积神经网络（ConvNets）在各种视觉识别任务中已经取得了优异的识别性能。大规模标注训练集是其成功的关键因素之一。然而，在某些领域，如表观年龄估计、头部姿态估计、多标签分类和语义分割中，收集带有精确标签的足够训练图像非常困难。幸运的是，标签之间存在模糊信息，这使得这些任务与传统分类有所不同。基于这一观察，我们将每张图像的标签转换为离散的标签分布，并通过最小化预测标签分布与真实标签分布之间的Kullback-Leibler散度来学习该标签分布，使用深度卷积神经网络实现这一目标。所提出的DLDL（深度标签分布学习）方法在特征学习和分类器学习中有效利用了标签的模糊性，即使在训练集较小的情况下也能帮助防止网络过拟合。实验结果表明，所提出的方法在年龄估计和头部姿态估计任务上显著优于现有最先进方法。同时，它还提高了多标签分类和语义分割任务的识别性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

计算机视觉

Bin-Bin Gao Chao Xing Chen-Wei Xie Jianxin Wu, Member, IEEE Xin Geng, Member, IEEE

摘要

卷积神经网络（ConvNets）在各种视觉识别任务中已经取得了优异的识别性能。大规模标注训练集是其成功的关键因素之一。然而，在某些领域，如表观年龄估计、头部姿态估计、多标签分类和语义分割中，收集带有精确标签的足够训练图像非常困难。幸运的是，标签之间存在模糊信息，这使得这些任务与传统分类有所不同。基于这一观察，我们将每张图像的标签转换为离散的标签分布，并通过最小化预测标签分布与真实标签分布之间的Kullback-Leibler散度来学习该标签分布，使用深度卷积神经网络实现这一目标。所提出的DLDL（深度标签分布学习）方法在特征学习和分类器学习中有效利用了标签的模糊性，即使在训练集较小的情况下也能帮助防止网络过拟合。实验结果表明，所提出的方法在年龄估计和头部姿态估计任务上显著优于现有最先进方法。同时，它还提高了多标签分类和语义分割任务的识别性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供