
摘要
尽管近年来提出了多种基于图像的域适应(Domain Adaptation, DA)技术,视频中的域偏移问题仍未得到充分研究。大多数先前的工作仅在规模较小且已饱和的数据集上评估性能。因此,我们首先提出了两个具有更大域差异的大规模视频DA数据集:UCF-HMDB_full和Kinetics-Gameplay。其次,我们探讨了不同的视频DA集成方法,并展示了同时对齐和学习时间动态可以实现有效的对齐,即使没有复杂的DA方法也是如此。最后,我们提出了一种时间注意力对抗适应网络(Temporal Attentive Adversarial Adaptation Network, TA3N),该网络通过显式关注时间动态并利用域差异来实现更有效的域对齐,在四个视频DA数据集上取得了最先进的性能(例如,在“HMDB → UCF”数据集上,“仅源模型”的准确率从73.9%提升至81.8%,提高了7.9%;在“Kinetics → Gameplay”数据集上提高了10.3%)。代码和数据已发布在http://github.com/cmhungsteve/TA3N。
代码仓库
olivesgatech/TA3N
pytorch
GitHub 中提及
mustafa1728/TA3N-Lightning-Kitchen_Domain_Adaptation
pytorch
GitHub 中提及
cmhungsteve/TA3N
官方
pytorch
GitHub 中提及
mustafa1728/TA3N-Lightning
pytorch
GitHub 中提及
jonmun/EPIC-KITCHENS-100_UDA_TA3N
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| domain-adaptation-on-hmdb-ucf-full | TA3N | Accuracy: 81.79 |
| domain-adaptation-on-ucf-hmdb-full | TA3N | Accuracy: 78.33 |
| unsupervised-domain-adaptation-on-epic | TA3N | Average Accuracy: 39.9 |
| unsupervised-domain-adaptation-on-hmdb-ucf | TA3N | Accuracy: 90.54 |
| unsupervised-domain-adaptation-on-jester-1 | TA3N | Accuracy: 55.5 |
| unsupervised-domain-adaptation-on-ucf-hmdb | TA3N | Accuracy: 81.38 |