
摘要
在无监督域适应(UDA)中,目标域(TD)的分类器是通过源域(SD)中的干净标签数据和目标域中的未标签数据进行训练的。然而,在实际应用中,由于预算有限,很难在源域获取大量完全干净的标签数据。因此,我们考虑了一个新的、更加现实且更具挑战性的问题设定,即分类器需要利用源域中的噪声标签数据和目标域中的未标签数据进行训练——我们将这种设定称为野生UDA(WUDA)。研究表明,如果不处理源域中的标签噪声,WUDA将破坏所有UDA方法。为此,我们提出了一种名为Butterfly框架的强大而高效的解决方案来应对WUDA。Butterfly同时维护四个深度网络,其中两个网络负责所有适应任务(即从噪声到干净、从有标签到无标签以及从源域分布到目标域分布),另外两个网络则专注于目标域中的分类任务。因此,Butterfly具备了解决WUDA所需的所有概念性组件。实验结果表明,在WUDA条件下,Butterfly显著优于现有的基线方法。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| domain-adaptation-on-noisy-amazon-20 | Butterfly | Average Accuracy: 71.53 |
| domain-adaptation-on-noisy-amazon-45 | Butterfly | Average Accuracy: 56.01 |
| domain-adaptation-on-noisy-mnist-to-synd | Butterfly | Average Accuracy: 57.55 |
| domain-adaptation-on-noisy-synd-to-mnist | Butterfly | Average Accuracy: 94.09 |
| wildly-unsupervised-domain-adaptation-on | Butterfly | Average Accuracy: 57.55 |
| wildly-unsupervised-domain-adaptation-on-1 | Butterfly | Average Accuracy: 94.09 |
| wildly-unsupervised-domain-adaptation-on-2 | Butterfly | Average Accuracy: 71.53 |
| wildly-unsupervised-domain-adaptation-on-3 | Butterfly | Average Accuracy: 56.01 |