
摘要
从视频中解析人类行为以预测其未来的路径/轨迹及未来的行为在许多应用中具有重要意义。基于这一理念,本文研究了同时预测行人的未来路径和未来活动。我们提出了一种端到端的多任务学习系统,该系统利用了丰富的视觉特征来捕捉人类行为信息及其与周围环境的互动。为了促进训练,网络通过一个辅助任务来学习预测活动发生的未来位置。实验结果表明,我们的方法在两个公开基准数据集上的未来轨迹预测性能达到了当前最佳水平。此外,我们的方法还能够生成有意义的未来活动预测,而不仅仅是路径。这一结果首次提供了实证证据,证明联合建模路径和活动有助于提高未来路径的预测准确性。
代码仓库
google/next-prediction
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| activity-prediction-on-actev | Next | mAP: 0.192 |
| trajectory-forecasting-on-actev | Next | ADE-8/12: 17.99 |
| trajectory-prediction-on-actev | Next | ADE-8/12: 17.99 FDE-8/12: 37.24 |
| trajectory-prediction-on-ethucy | Next | ADE-8/12: 0.46 |