6 个月前

监督式微调

自然语言处理

Yao Zhao Misha Khalman Rishabh Joshi Shashi Narayan Mohammad Saleh Peter J. Liu

摘要

条件语言模型主要通过最大似然估计（Maximum Likelihood Estimation, MLE）进行训练，这会导致模型为稀疏观测的目标序列分配较高的概率质量。尽管MLE训练的模型在给定上下文时能够为合理序列赋予高概率，但其生成序列的概率分布往往无法准确反映序列质量的优劣排序。这一现象在束搜索（beam search）解码中已被实证观察到：随着束宽增大，生成质量反而下降，且解码策略通常依赖诸如长度归一化和重复抑制等启发式方法来提升性能。在本工作中，我们提出了序列似然校准（Sequence Likelihood Calibration, SLiC），通过将模型生成序列的似然度在隐空间中进行校准，使其更贴近参考序列的分布。引入SLiC后，解码过程不再需要依赖各类启发式策略，且无论采用何种解码方法，生成候选序列的质量均显著提升。此外，SLiC在模型规模扩大时未表现出收益递减的迹象，为在有限训练与推理资源下提升生成质量提供了新的有效途径。实验表明，在涵盖抽象摘要、问题生成、抽象问答以及数据到文本生成等多种生成任务上，SLiC均能实现或超越当前最优（SOTA）性能，即使在中等规模模型上亦可取得优异结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

监督式微调

自然语言处理

Yao Zhao Misha Khalman Rishabh Joshi Shashi Narayan Mohammad Saleh Peter J. Liu

摘要

条件语言模型主要通过最大似然估计（Maximum Likelihood Estimation, MLE）进行训练，这会导致模型为稀疏观测的目标序列分配较高的概率质量。尽管MLE训练的模型在给定上下文时能够为合理序列赋予高概率，但其生成序列的概率分布往往无法准确反映序列质量的优劣排序。这一现象在束搜索（beam search）解码中已被实证观察到：随着束宽增大，生成质量反而下降，且解码策略通常依赖诸如长度归一化和重复抑制等启发式方法来提升性能。在本工作中，我们提出了序列似然校准（Sequence Likelihood Calibration, SLiC），通过将模型生成序列的似然度在隐空间中进行校准，使其更贴近参考序列的分布。引入SLiC后，解码过程不再需要依赖各类启发式策略，且无论采用何种解码方法，生成候选序列的质量均显著提升。此外，SLiC在模型规模扩大时未表现出收益递减的迹象，为在有限训练与推理资源下提升生成质量提供了新的有效途径。实验表明，在涵盖抽象摘要、问题生成、抽象问答以及数据到文本生成等多种生成任务上，SLiC均能实现或超越当前最优（SOTA）性能，即使在中等规模模型上亦可取得优异结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

校准序列似然性可提升条件语言生成性能 | 论文 | HyperAI超神经