7 个月前

多任务学习

Mitchell Wortsman Kiana Ehsani Mohammad Rastegari Ali Farhadi Roozbeh Mottaghi

摘要

学习本质上是一个连续的过程。当人类学习新任务时，并没有明确的训练和推理阶段之分。在执行任务的过程中，我们不断学习和完善对任务的理解。我们在不同学习阶段所学的内容和学习方式各不相同。学会如何学习和适应是我们能够轻松应对新环境的关键属性。这与传统机器学习中的设置形成鲜明对比，在传统设置中，经过训练的模型在推理过程中是固定的。本文研究了在视觉导航背景下，同时在训练时间和测试时间进行“学会学习”的问题。导航的一个基本挑战是在未见过的场景中实现泛化。为此，我们提出了一种自适应视觉导航方法（Self-Adaptive Visual Navigation, SAVN），该方法能够在没有任何显式监督的情况下适应新环境。我们的解决方案是一种元强化学习方法，其中代理学会一种自我监督的交互损失函数，以促进有效的导航行为。我们在AI2-THOR框架下进行的实验表明，该方法在新颖场景中的视觉导航成功率和SPL（Success-weighted by Path Length）方面均取得了显著提升。我们的代码和数据可在以下链接获取：https://github.com/allenai/savn 。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

多任务学习

Mitchell Wortsman Kiana Ehsani Mohammad Rastegari Ali Farhadi Roozbeh Mottaghi

摘要

学习本质上是一个连续的过程。当人类学习新任务时，并没有明确的训练和推理阶段之分。在执行任务的过程中，我们不断学习和完善对任务的理解。我们在不同学习阶段所学的内容和学习方式各不相同。学会如何学习和适应是我们能够轻松应对新环境的关键属性。这与传统机器学习中的设置形成鲜明对比，在传统设置中，经过训练的模型在推理过程中是固定的。本文研究了在视觉导航背景下，同时在训练时间和测试时间进行“学会学习”的问题。导航的一个基本挑战是在未见过的场景中实现泛化。为此，我们提出了一种自适应视觉导航方法（Self-Adaptive Visual Navigation, SAVN），该方法能够在没有任何显式监督的情况下适应新环境。我们的解决方案是一种元强化学习方法，其中代理学会一种自我监督的交互损失函数，以促进有效的导航行为。我们在AI2-THOR框架下进行的实验表明，该方法在新颖场景中的视觉导航成功率和SPL（Success-weighted by Path Length）方面均取得了显著提升。我们的代码和数据可在以下链接获取：https://github.com/allenai/savn 。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

学习如何学习：使用元学习的自适应视觉导航 | 论文 | HyperAI超神经