6 个月前

摘要

最佳N项（Best-of-N, BoN）平均位移误差（Average Displacement Error, ADE）/最终位移误差（Final Displacement Error, FDE）是评估轨迹预测模型最常用的指标。然而，BoN仅关注生成样本中的最优结果，未能全面反映所有生成样本的分布特性，从而导致对模型预测质量与性能的评估存在不完整性。为此，本文提出一种新指标——平均马哈拉诺比斯距离（Average Mahalanobis Distance, AMD），用于量化生成样本整体与真实轨迹之间的接近程度。此外，我们引入了平均最大特征值（Average Maximum Eigenvalue, AMV）指标，用于衡量预测结果的整体扩散程度。通过实证分析，我们验证了ADE/FDE对分布偏移（distribution shift）不敏感，容易产生对模型准确性的偏差判断，而AMD和AMV指标则能更客观、全面地反映模型性能。为实现与AMD/AMV目标一致的训练机制，本文采用隐式最大似然估计（Implicit Maximum Likelihood Estimation, IMLE）替代传统生成模型，用于训练所提出的模型——Social-Implicit。IMLE的训练策略与AMD/AMV的目标高度契合，即生成既贴近真实轨迹又具有紧凑分布的预测结果。Social-Implicit是一种内存高效的深度模型，仅包含5.8K个参数，可在约580Hz的实时频率下运行，同时取得了具有竞争力的预测性能。相关问题的交互式演示可访问：https://www.abduallahmohamed.com/social-implicit-amdamv-adefde-demo。代码已开源，地址为：https://github.com/abduallahmohamed/Social-Implicit。

源 PDF 查看代码