
摘要
语义分割旨在预测每个像素的类别标签,已成为计算机视觉诸多应用中的热门任务。尽管全监督分割方法在大规模视觉数据集上取得了较高的精度,但在面对新的测试环境或新领域时,其泛化能力仍显不足。本文首先提出一种新的“非对齐域评分”(Un-aligned Domain Score),用于在无监督条件下衡量模型在新目标域上的性能效率。随后,我们提出一种新的双射最大似然损失(Bijective Maximum Likelihood, BiMaL),该损失函数是无需假设像素独立性的对抗熵最小化方法的广义形式。我们在两个不同域上对所提出的BiMaL方法进行了评估,实验结果表明,在“SYNTHIA到Cityscapes”、“GTA5到Cityscapes”以及“SYNTHIA到Vistas”三个典型域适应任务中,该方法在各项指标上均持续优于当前最优(SOTA)方法。
代码仓库
uark-cviu/bimal
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| domain-adaptation-on-synthia-to-cityscapes | BiMaL | mIoU: 46.2 |
| unsupervised-domain-adaptation-on-gtav-to | BiMaL | mIoU: 47.3 |