7 个月前

摘要

我们介绍了一种用于动态场景中多个交互代理未来预测任务的深度随机IOC RNN编码器-解码器框架，即DESIRE。DESIRE通过以下三个方面的有效预测，成功地在多种场景下预测了物体的未来位置：1）考虑未来预测的多模态性质（即，在相同的上下文中，未来可能有所不同），2）预见潜在的未来结果并据此进行战略性预测，3）不仅从过去的运动历史中推理，还从场景上下文以及代理之间的互动中进行推理。DESIRE在一个端到端可训练的神经网络模型中实现了这些目标，同时保持了计算效率。该模型首先利用条件变分自编码器生成一组多样化的假设未来预测样本，然后通过后续的RNN评分-回归模块对这些样本进行排序和优化。样本评分时考虑了累积未来的奖励，这使得模型能够做出类似于IOC框架的更好的长期战略决策。RNN场景上下文融合模块联合捕捉过去运动历史、语义场景上下文以及多个代理之间的互动。反馈机制则通过迭代排序和优化过程进一步提高预测准确性。我们在两个公开数据集上评估了我们的模型：KITTI和斯坦福无人机数据集（Stanford Drone Dataset）。实验结果表明，所提出的模型相比其他基线方法显著提高了预测准确性。

源 PDF