
摘要
表格提供了可用于验证文本陈述的宝贵知识。尽管已有许多研究关注基于表格的事实验证,但通常很难直接将表格数据与文本陈述中的标记对齐。此外,训练一个通用的事实验证模型需要大量的标注训练数据。在本文中,我们提出了一种新颖的系统来解决这些问题。受反事实因果关系的启发,我们的系统通过基于探测的显著性估计来识别陈述中的标记级显著性。显著性估计从两个方面增强了事实验证的学习效果。一方面,我们的系统进行掩码显著标记预测,以增强模型在表格与陈述之间的对齐和推理能力;另一方面,我们的系统应用显著性感知的数据增强方法,通过替换非显著项生成更多样化的训练实例集。我们在TabFact上的实验结果表明,所提出的显著性感知学习技术有效提升了性能,并在该基准测试中达到了新的最先进水平(SOTA)。我们的代码已公开发布在 https://github.com/luka-group/Salience-aware-Learning 。
代码仓库
luka-group/salience-aware-learning
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| table-based-fact-verification-on-tabfact | Salience-aware TAPAS | Test: 82.1 Val: 82.7 |