
摘要
行人轨迹预测是自动驾驶和机器人导航等机器人应用中的关键任务。当前最先进的轨迹预测方法通常采用基于循环神经网络(RNN)的条件变分自编码器(CVAE)架构,通过编码器对观测到的轨迹进行建模,并利用解码器生成多模态的未来轨迹。然而,该方法在较长预测时域(≥2秒)下容易产生累积误差。本文提出了一种基于CVAE的目标条件双向多模态轨迹预测方法——BiTraP。该方法通过估计轨迹的终点(目标点),并引入一种新颖的双向解码器结构,显著提升了长期轨迹预测的准确性。大量实验表明,BiTraP在第一人称视角(FPV)和鸟瞰视角(BEV)两种场景下均具有良好的泛化能力,预测性能相较现有最先进方法提升约10%至50%。此外,本文还揭示了CVAE中非参数化与参数化目标模型的选择会直接影响预测的多模态轨迹分布特性。这些发现为机器人应用中碰撞规避与导航系统等轨迹预测器的设计提供了重要指导。
代码仓库
umautobots/bidireaction-trajectory-prediction
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| trajectory-prediction-on-jaad | BiTrap-D | CF_MSE(1.5): 4565 C_MSE(1.5): 1105 MSE(0.5): 93 MSE(1.0): 378 MSE(1.5): 1206 |
| trajectory-prediction-on-pie | Bitrap-D | CF_MSE(1.5): 1949 C_MSE(1.5): 481 MSE(0.5): 41 MSE(1.0): 161 MSE(1.5): 511 |