LiRonghui ; ZhangHongwen ; ZhangYachao ; ZhangYuxiang ; ZhangYouliang ; GuoJie ; ZhangYan ; LiXiu ; LiuYebin

摘要
我们提出了一种名为Lodge++的编舞框架,该框架能够在给定音乐和所需舞蹈类型的情况下生成高质量、超长且生动的舞蹈。为了应对计算效率、复杂且生动的整体编舞模式学习以及局部舞蹈动作物理质量等方面的挑战,Lodge++采用了两阶段策略,从粗到细地生成舞蹈。在第一阶段,设计了一个全局编舞网络,用于生成捕捉复杂整体编舞模式的粗粒度舞蹈基本元素。在第二阶段,基于这些舞蹈基本元素,提出了一种基于基本元素的舞蹈扩散模型,以并行方式进一步生成高质量、长序列的舞蹈,忠实遵循复杂的编舞模式。此外,为了提高物理合理性,Lodge++还引入了穿透引导模块来解决角色自穿透问题、足部优化模块来改进脚与地面的接触情况,以及多类型判别器来保持整个舞蹈的类型一致性。通过广泛的实验验证,Lodge++展示了我们的方法可以快速生成适合多种舞蹈类型的超长舞蹈,确保了良好的整体编舞模式和高质量的局部动作。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| motion-synthesis-on-finedance | Lodge++ | BAS: 0.2423 fid_k: 40.77 |