4 个月前

DESIRE:动态场景中交互代理的远期预测

DESIRE:动态场景中交互代理的远期预测

摘要

我们介绍了一种用于动态场景中多个交互代理未来预测任务的深度随机IOC RNN编码器-解码器框架,即DESIRE。DESIRE通过以下三个方面的有效预测,成功地在多种场景下预测了物体的未来位置:1)考虑未来预测的多模态性质(即,在相同的上下文中,未来可能有所不同),2)预见潜在的未来结果并据此进行战略性预测,3)不仅从过去的运动历史中推理,还从场景上下文以及代理之间的互动中进行推理。DESIRE在一个端到端可训练的神经网络模型中实现了这些目标,同时保持了计算效率。该模型首先利用条件变分自编码器生成一组多样化的假设未来预测样本,然后通过后续的RNN评分-回归模块对这些样本进行排序和优化。样本评分时考虑了累积未来的奖励,这使得模型能够做出类似于IOC框架的更好的长期战略决策。RNN场景上下文融合模块联合捕捉过去运动历史、语义场景上下文以及多个代理之间的互动。反馈机制则通过迭代排序和优化过程进一步提高预测准确性。我们在两个公开数据集上评估了我们的模型:KITTI和斯坦福无人机数据集(Stanford Drone Dataset)。实验结果表明,所提出的模型相比其他基线方法显著提高了预测准确性。

基准测试

基准方法指标
trajectory-prediction-on-interaction-dataset-2DESIRE
minADE6: 0.32
minFDE6: 0.88
trajectory-prediction-on-paidDESIRE
minADE3: 0.29
minFDE3: 0.59
trajectory-prediction-on-stanford-droneDESIRE
ADE (8/12) @K=5: 19.25
ADE-8/12 @K = 20: 19.25
FDE(8/12) @K=5: 34.05
FDE-8/12 @K= 20: 34.05

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DESIRE:动态场景中交互代理的远期预测 | 论文 | HyperAI超神经