
摘要
利用由偏微分方程(PDEs)所描述的物理知识,是一种提升无监督视频预测方法性能的有吸引力途径。由于物理规律对通用视频的完整视觉内容描述过于受限,本文提出PhyDNet,一种双分支深度神经架构,能够显式地将PDE动力学与未知的互补信息解耦。第二个贡献是提出一种新型循环物理单元(PhyCell),其灵感源自数据同化技术,用于在隐空间中实现PDE约束下的视频预测。在四个不同数据集上开展的大量实验表明,PhyDNet能够显著优于当前最先进的方法。消融实验进一步验证了解耦机制与PDE约束预测所带来的显著性能提升。最后,本文还展示了PhyDNet在处理缺失数据和长期预测任务中所具备的优异特性。
代码仓库
cognitivemodeling/finn
pytorch
GitHub 中提及
chengtan9907/simvpv2
pytorch
GitHub 中提及
vincent-leguen/PhyDNet
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-prediction-on-human36m | PhyDNet | MAE: 1620 MSE: 369 SSIM: 0.901 |
| video-prediction-on-moving-mnist | PhyDNet | MAE: 70.3 MSE: 24.4 SSIM: 0.947 |
| video-prediction-on-synpickvp | PhyDNet | LPIPS: 0.053 MSE: 57.31 PSNR: 26.84 SSIM: 0.877 |
| weather-forecasting-on-sevir | PhyDNet | MSE: 4.8165 mCSI: 0.3940 |