4 个月前

参考意识语言模型

参考意识语言模型

摘要

我们提出了一类通用的语言模型,该模型将指代视为一个显式的随机潜在变量。这种架构使得模型可以通过访问外部数据库(例如对话生成和菜谱生成所需)和内部状态(例如共指识别语言模型所需)来创建实体及其属性的提及。这有助于在数据库或话语上下文中可预测位置获取的信息的整合,即使这些指代的目标可能是罕见词汇。我们在三个任务上的实验展示了基于确定性注意力机制的模型变体的效果。

基准测试

基准方法指标
recipe-generation-on-allrecipescomLatent Variable Model
BLEU: 15.41
Perplexity: 4.97

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
参考意识语言模型 | 论文 | HyperAI超神经