4 个月前

Uni-Sign:面向大规模的统一手语理解

Uni-Sign:面向大规模的统一手语理解

摘要

手语预训练因其在各种手语理解(SLU)任务中提升性能的能力而受到越来越多的关注。然而,现有的方法往往存在预训练与微调之间的差距,导致结果次优。为了解决这一问题,我们提出了Uni-Sign,一种统一的预训练框架,通过大规模生成式预训练策略和新颖的微调范式消除了预训练与下游SLU任务之间的差距。首先,我们介绍了CSL-News,这是一个包含1,985小时视频及其文本注释的大规模中国手语(CSL)数据集,能够实现有效的大型预训练。其次,Uni-Sign通过在微调阶段将下游任务视为单一的手语翻译(SLT)任务来统一SLU任务,确保了预训练与微调之间知识的无缝转移。此外,我们引入了一个先验引导融合(PGF)模块和一个分数感知采样策略,以高效地融合姿态和RGB信息,解决了关键点不准确的问题并提高了计算效率。我们在多个SLU基准测试上的大量实验表明,Uni-Sign在多个下游SLU任务上达到了最先进的性能。数据集和代码可在github.com/ZechengLi19/Uni-Sign获取。

代码仓库

zechengli19/uni-sign
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
sign-language-recognition-on-csl-dailyUni-Sign
Word Error Rate (WER): 26.0
sign-language-recognition-on-ms-aslUni-Sign
P-C Top-1 Accuracy: 76.97
P-I Top-1 Accuracy: 78.16
sign-language-recognition-on-wlasl-2000Uni-Sign
Top-1 Accuracy: 63.52
sign-language-recognition-on-wlasl100Uni-Sign
Top-1 Accuracy: 92.25

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Uni-Sign:面向大规模的统一手语理解 | 论文 | HyperAI超神经