HyperAIHyperAI

Command Palette

Search for a command to run...

学习如何学习:使用元学习的自适应视觉导航

Mitchell Wortsman Kiana Ehsani Mohammad Rastegari Ali Farhadi Roozbeh Mottaghi

摘要

学习本质上是一个连续的过程。当人类学习新任务时,并没有明确的训练和推理阶段之分。在执行任务的过程中,我们不断学习和完善对任务的理解。我们在不同学习阶段所学的内容和学习方式各不相同。学会如何学习和适应是我们能够轻松应对新环境的关键属性。这与传统机器学习中的设置形成鲜明对比,在传统设置中,经过训练的模型在推理过程中是固定的。本文研究了在视觉导航背景下,同时在训练时间和测试时间进行“学会学习”的问题。导航的一个基本挑战是在未见过的场景中实现泛化。为此,我们提出了一种自适应视觉导航方法(Self-Adaptive Visual Navigation, SAVN),该方法能够在没有任何显式监督的情况下适应新环境。我们的解决方案是一种元强化学习方法,其中代理学会一种自我监督的交互损失函数,以促进有效的导航行为。我们在AI2-THOR框架下进行的实验表明,该方法在新颖场景中的视觉导航成功率和SPL(Success-weighted by Path Length)方面均取得了显著提升。我们的代码和数据可在以下链接获取:https://github.com/allenai/savn


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供