4 个月前

学习如何学习:使用元学习的自适应视觉导航

学习如何学习:使用元学习的自适应视觉导航

摘要

学习本质上是一个连续的过程。当人类学习新任务时,并没有明确的训练和推理阶段之分。在执行任务的过程中,我们不断学习和完善对任务的理解。我们在不同学习阶段所学的内容和学习方式各不相同。学会如何学习和适应是我们能够轻松应对新环境的关键属性。这与传统机器学习中的设置形成鲜明对比,在传统设置中,经过训练的模型在推理过程中是固定的。本文研究了在视觉导航背景下,同时在训练时间和测试时间进行“学会学习”的问题。导航的一个基本挑战是在未见过的场景中实现泛化。为此,我们提出了一种自适应视觉导航方法(Self-Adaptive Visual Navigation, SAVN),该方法能够在没有任何显式监督的情况下适应新环境。我们的解决方案是一种元强化学习方法,其中代理学会一种自我监督的交互损失函数,以促进有效的导航行为。我们在AI2-THOR框架下进行的实验表明,该方法在新颖场景中的视觉导航成功率和SPL(Success-weighted by Path Length)方面均取得了显著提升。我们的代码和数据可在以下链接获取:https://github.com/allenai/savn 。

代码仓库

allenai/savn
官方
pytorch
GitHub 中提及
barmayo/spatial_attention
pytorch
GitHub 中提及

基准测试

基准方法指标
visual-navigation-on-ai2-thorSAVN
SPL (All): 16.15
SPL (L≥5): 13.91
Success Rate (All): 40.86
Success Rate (L≥5): 28.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
学习如何学习:使用元学习的自适应视觉导航 | 论文 | HyperAI超神经