4 个月前

TransferTransfo:一种基于神经网络的对话代理的迁移学习方法

TransferTransfo:一种基于神经网络的对话代理的迁移学习方法

摘要

我们介绍了一种新的生成式数据驱动对话系统(例如聊天机器人)的方法,称为TransferTransfo,该方法结合了基于迁移学习的训练方案和高容量的Transformer模型。通过使用多任务目标对模型进行微调,该目标结合了多个无监督预测任务。与当前最先进的端到端对话模型(如记忆增强型序列到序列模型和信息检索模型)相比,经过微调后的模型表现出显著的改进。在Conversational Intelligence Challenge 2的私有PERSONA-CHAT数据集上,这种方法取得了新的最先进水平,其相应的困惑度、Hits@1和F1指标分别为16.28(绝对改进45%)、80.7(绝对改进46%)和19.5(绝对改进20%)。

代码仓库

cerebroai/AskIt
pytorch
GitHub 中提及
DevHyung/dialogue_cl
pytorch
GitHub 中提及
noriyukipy/gptchat
pytorch
GitHub 中提及
the-pythoncoder/counsel-chat
pytorch
GitHub 中提及
KhueNguyen312/Persona-Chatbot
pytorch
GitHub 中提及
pranavgollamudi/Chatbot
pytorch
GitHub 中提及
dladustn95/enLanguageModel
pytorch
GitHub 中提及
BSlience/end2end-conversational-ai
pytorch
GitHub 中提及
samsonleegh/convai_smile
pytorch
GitHub 中提及
liliaellouz/wabi-sabi
pytorch
GitHub 中提及
xnancy/convai-transformer
pytorch
GitHub 中提及
Vergangenheit/Conv-AI
pytorch
GitHub 中提及
the-pythoncoder/councelChatbot2
pytorch
GitHub 中提及
CP8315-NNP-JLOPEZ/NNP-Chatbot
pytorch
GitHub 中提及
AjayKhalsa/convai_smile
pytorch
GitHub 中提及
ErikEkstedt/TurnGPT
pytorch
GitHub 中提及
dladustn95/ENMODEL
pytorch
GitHub 中提及
thu-coai/CDial-GPT
pytorch
GitHub 中提及

基准测试

基准方法指标
dialogue-generation-on-persona-chat-1TransferTransfo
Avg F1: 19.09

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TransferTransfo:一种基于神经网络的对话代理的迁移学习方法 | 论文 | HyperAI超神经