3 个月前

社会隐式:重新思考轨迹预测评估与隐式最大似然估计的有效性

社会隐式:重新思考轨迹预测评估与隐式最大似然估计的有效性

摘要

最佳N项(Best-of-N, BoN)平均位移误差(Average Displacement Error, ADE)/最终位移误差(Final Displacement Error, FDE)是评估轨迹预测模型最常用的指标。然而,BoN仅关注生成样本中的最优结果,未能全面反映所有生成样本的分布特性,从而导致对模型预测质量与性能的评估存在不完整性。为此,本文提出一种新指标——平均马哈拉诺比斯距离(Average Mahalanobis Distance, AMD),用于量化生成样本整体与真实轨迹之间的接近程度。此外,我们引入了平均最大特征值(Average Maximum Eigenvalue, AMV)指标,用于衡量预测结果的整体扩散程度。通过实证分析,我们验证了ADE/FDE对分布偏移(distribution shift)不敏感,容易产生对模型准确性的偏差判断,而AMD和AMV指标则能更客观、全面地反映模型性能。为实现与AMD/AMV目标一致的训练机制,本文采用隐式最大似然估计(Implicit Maximum Likelihood Estimation, IMLE)替代传统生成模型,用于训练所提出的模型——Social-Implicit。IMLE的训练策略与AMD/AMV的目标高度契合,即生成既贴近真实轨迹又具有紧凑分布的预测结果。Social-Implicit是一种内存高效的深度模型,仅包含5.8K个参数,可在约580Hz的实时频率下运行,同时取得了具有竞争力的预测性能。相关问题的交互式演示可访问:https://www.abduallahmohamed.com/social-implicit-amdamv-adefde-demo。代码已开源,地址为:https://github.com/abduallahmohamed/Social-Implicit。

代码仓库

abduallahmohamed/social-implicit
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
trajectory-prediction-on-ethSocial-Implicit
Avg AMD/AMV 8/12: 0.90
trajectory-prediction-on-ethucySocial-Implicit
ADE-8/12: 0.33
FDE-8/12: 0.33
trajectory-prediction-on-stanford-droneSocial-Implicit
ADE (in world coordinates): 0.47
AMD: 2.83
AMV: 0.077
Avg AMD/AMV 8/12: 1.45
FDE (in world coordinates): 0.89
trajectory-prediction-on-ucySocial-Implicit
Avg AMD/AMV 8/12: 0.90

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
社会隐式:重新思考轨迹预测评估与隐式最大似然估计的有效性 | 论文 | HyperAI超神经