3 个月前

纹理学习领域随机化用于领域泛化的分割

纹理学习领域随机化用于领域泛化的分割

摘要

基于深度神经网络(DNN)的语义分割模型在源域上训练后,通常难以泛化至未见的目标域,即存在域间差异(domain gap)问题。纹理特征往往是导致域差异的重要因素,使得DNN模型在面对域迁移时表现脆弱,因其容易产生对纹理的偏好(texture bias)。现有的领域泛化语义分割(Domain Generalized Semantic Segmentation, DGSS)方法通过引导模型优先关注形状而非纹理,已在一定程度上缓解了域差异问题。然而,形状与纹理是语义分割中两种显著且互补的视觉线索。本文认为,在DGSS任务中有效利用纹理信息对于提升模型性能至关重要。为此,本文提出一种新颖的框架——纹理学习域随机化(Texture Learning Domain Randomization, TLDR)。TLDR引入两种新型损失函数,以有效增强DGSS中纹理特征的学习能力:(1)纹理正则化损失(texture regularization loss),通过引入在ImageNet上预训练模型提取的纹理特征,防止模型过度拟合源域的纹理;(2)纹理泛化损失(texture generalization loss),利用随机风格图像在自监督学习框架下学习多样化纹理表征。大量实验结果表明,所提出的TLDR框架具有显著优势。例如,在GTA5到Cityscapes的跨域迁移任务中,基于ResNet-50的TLDR模型取得了46.5 mIoU的性能,较现有最先进方法提升了1.9 mIoU。相关源代码已开源,地址为:https://github.com/ssssshwan/TLDR。

代码仓库

ssssshwan/tldr
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
domain-generalization-on-gta-to-avgTLDR
mIoU: 47.09

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
纹理学习领域随机化用于领域泛化的分割 | 论文 | HyperAI超神经