Action Recognition On Charades Ego

mAP

评测结果

各个模型在此基准测试上的表现结果

		Paper Title
LaViLa (Finetuned, TimeSformer-L)	36.1	Learning Video Representations from Large Language Models
EgoVLPv2	34.1	EgoVLPv2: Egocentric Video-Language Pre-training with Fusion in the Backbone
HierVL	33.8	HierVL: Learning Hierarchical Video-Language Embeddings
EgoVLP	32.1	Egocentric Video-Language Pretraining
LaViLa (Zero-shot, TimeSformer-L)	28.9	Learning Video Representations from Large Language Models
HierVL (Zero-shot)	26	HierVL: Learning Hierarchical Video-Language Embeddings

0 of 6 row(s) selected.