3 个月前

校准序列似然性可提升条件语言生成性能

校准序列似然性可提升条件语言生成性能

摘要

条件语言模型主要通过最大似然估计(Maximum Likelihood Estimation, MLE)进行训练,这会导致模型为稀疏观测的目标序列分配较高的概率质量。尽管MLE训练的模型在给定上下文时能够为合理序列赋予高概率,但其生成序列的概率分布往往无法准确反映序列质量的优劣排序。这一现象在束搜索(beam search)解码中已被实证观察到:随着束宽增大,生成质量反而下降,且解码策略通常依赖诸如长度归一化和重复抑制等启发式方法来提升性能。在本工作中,我们提出了序列似然校准(Sequence Likelihood Calibration, SLiC),通过将模型生成序列的似然度在隐空间中进行校准,使其更贴近参考序列的分布。引入SLiC后,解码过程不再需要依赖各类启发式策略,且无论采用何种解码方法,生成候选序列的质量均显著提升。此外,SLiC在模型规模扩大时未表现出收益递减的迹象,为在有限训练与推理资源下提升生成质量提供了新的有效途径。实验表明,在涵盖抽象摘要、问题生成、抽象问答以及数据到文本生成等多种生成任务上,SLiC均能实现或超越当前最优(SOTA)性能,即使在中等规模模型上亦可取得优异结果。

基准测试

基准方法指标
abstractive-text-summarization-on-cnn-dailyPegasus
ROUGE-1: 47.36
ROUGE-2: 24.02
ROUGE-L: 44.45
text-summarization-on-reddit-tifuPEGASUS 2B + SLiC
ROUGE-1: 32.03
ROUGE-2: 11.13
ROUGE-L: 25.51
text-summarization-on-samsum-corpusPEGASUS 2B + SliC
ROUGE-1: 54.37
ROUGE-2: 29.88
ROUGE-L: 45.89

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
校准序列似然性可提升条件语言生成性能 | 论文 | HyperAI超神经