8 个月前

摘要

具有注意力机制的循环神经网络模型在各种序列到序列问题上已被证明极为有效。然而，软注意力机制在生成输出序列的每个元素时都需要遍历整个输入序列，这不仅限制了其在在线环境中的应用，还导致了时间复杂度为二次方的问题。基于许多感兴趣的问题中输入和输出序列元素之间的对齐关系是单调的这一观察，我们提出了一种端到端可微的方法来学习单调对齐关系。该方法在测试阶段能够实现在线且线性时间复杂度的注意力计算。我们在句子摘要、机器翻译和在线语音识别问题上验证了我们的方法，并取得了与现有序列到序列模型相当的结果。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

Colin Raffel Minh-Thang Luong Peter J. Liu Ron J. Weiss Douglas Eck

摘要

具有注意力机制的循环神经网络模型在各种序列到序列问题上已被证明极为有效。然而，软注意力机制在生成输出序列的每个元素时都需要遍历整个输入序列，这不仅限制了其在在线环境中的应用，还导致了时间复杂度为二次方的问题。基于许多感兴趣的问题中输入和输出序列元素之间的对齐关系是单调的这一观察，我们提出了一种端到端可微的方法来学习单调对齐关系。该方法在测试阶段能够实现在线且线性时间复杂度的注意力计算。我们在句子摘要、机器翻译和在线语音识别问题上验证了我们的方法，并取得了与现有序列到序列模型相当的结果。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

通过强制单调对齐实现在线和线性时间注意力机制

Colin Raffel Minh-Thang Luong Peter J. Liu Ron J. Weiss Douglas Eck

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

通过强制单调对齐实现在线和线性时间注意力机制

Colin Raffel Minh-Thang Luong Peter J. Liu Ron J. Weiss Douglas Eck

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

通过强制单调对齐实现在线和线性时间注意力机制

Colin Raffel Minh-Thang Luong Peter J. Liu Ron J. Weiss Douglas Eck

摘要

用 AI 构建 AI

HyperAI Newsletters