4 个月前

利用半监督学习改进地标定位

利用半监督学习改进地标定位

摘要

我们提出了两种技术,以提高部分标注数据集中的图像地标定位精度。我们的主要目标是在仅有少量数据子集提供精确地标位置的情况下,充分利用与这些地标相关的分类或回归任务中更为丰富的类别标签。首先,我们提出了一种顺序多任务框架,并通过一种用于地标定位的架构来探索这一框架,其中类别标签作为辅助信号指导未标注数据上的地标定位。我们方法的一个关键方面是错误可以通过完整的地标定位模型进行反向传播。其次,我们提出并探索了一种基于图像变换预测等变地标的无监督学习技术。我们展示了这些技术显著提高了地标的预测精度,并且即使在数据集中只有很小一部分具有地标标签时也能学习到有效的检测器。我们在两个玩具数据集和四个真实数据集上进行了实验,涉及手部和面部的地标定位,并在两个野外数据集上报告了新的最先进结果,例如,在仅使用5%的标注图像时,我们在AFLW数据集上的表现超过了以往的所有最先进方法。

基准测试

基准方法指标
face-alignment-on-300wRCN
NME_inter-ocular (%, Challenge): 7.78
NME_inter-ocular (%, Common): 4.20
NME_inter-ocular (%, Full): 4.90

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
利用半监督学习改进地标定位 | 论文 | HyperAI超神经