3 个月前

DiffCSE:基于差异的对比学习句向量表示

DiffCSE:基于差异的对比学习句向量表示

摘要

我们提出 DiffCSE,一种用于学习句子嵌入的无监督对比学习框架。DiffCSE 学习的句子嵌入能够敏感地捕捉原始句子与其编辑后句子之间的差异,其中编辑后的句子通过随机遮蔽原始句子,再从掩码语言模型中采样得到。我们证明,DiffCSE 是等变对比学习(equivariant contrastive learning, Dangovski 等,2021)的一个实例,该方法扩展了传统对比学习,能够学习对某些类型数据增强不敏感、但对其他“有害”类型增强敏感的表示。实验结果表明,DiffCSE 在无监督句子表示学习方法中达到了当前最优性能,在语义文本相似度任务上,相较于无监督 SimCSE 提升了 2.3 个百分点的绝对准确率。

代码仓库

voidism/diffcse
官方
jax
GitHub 中提及

基准测试

基准方法指标
semantic-textual-similarity-on-sts12DiffCSE-RoBERTa-base
Spearman Correlation: 0.7005
semantic-textual-similarity-on-sts12DiffCSE-BERT-base
Spearman Correlation: 0.7228
semantic-textual-similarity-on-sts13DiffCSE-BERT-base
Spearman Correlation: 0.8443
semantic-textual-similarity-on-sts13DiffCSE-RoBERTa-base
Spearman Correlation: 0.8343
semantic-textual-similarity-on-sts14DiffCSE-BERT-base
Spearman Correlation: 0.7647
semantic-textual-similarity-on-sts14DiffCSE-RoBERTa-base
Spearman Correlation: 0.7549
semantic-textual-similarity-on-sts15DiffCSE-BERT-base
Spearman Correlation: 0.8390
semantic-textual-similarity-on-sts15DiffCSE-RoBERTa-base
Spearman Correlation: 0.8281
semantic-textual-similarity-on-sts16DiffCSE-RoBERTa-base
Spearman Correlation: 0.8212
semantic-textual-similarity-on-sts16DiffCSE-BERT-base
Spearman Correlation: 0.8054

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DiffCSE:基于差异的对比学习句向量表示 | 论文 | HyperAI超神经