HyperAIHyperAI

Command Palette

Search for a command to run...

HD-CNN:用于大规模视觉识别的分层深度卷积神经网络

Zhicheng Yan†, Hao Zhang‡, Robinson Piramuthu*, Vignesh Jagadeesh*, Dennis DeCoste*, Wei Di*, Yizhou Yu*

摘要

在图像分类中,不同物体类别之间的视觉可分离性存在显著差异,某些类别的区分难度远高于其他类别。这些难以区分的类别需要更加专门的分类器。然而,现有的深度卷积神经网络(CNN)通常作为扁平的N路分类器进行训练,很少有研究尝试利用类别的层次结构。本文中,我们通过将深度CNN嵌入到类别层次结构中引入了层次深度CNN(HD-CNN)。一个HD-CNN使用粗略类别分类器来分离容易区分的类别,而使用精细类别分类器来区分难以区分的类别。在HD-CNN训练过程中,首先进行组件预训练,然后通过多名义逻辑损失并结合粗略类别一致性项进行全局微调。此外,条件执行精细类别分类器和层参数压缩使得HD-CNN能够在大规模视觉识别任务中具有可扩展性。我们在CIFAR100和大规模ImageNet 1000类基准数据集上均取得了最先进的结果。实验中,我们构建了三种不同的HD-CNN模型,它们分别将标准CNN的Top-1错误率降低了2.65%、3.1%和1.1%。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供