
摘要
基于给定证据验证文本假设是否成立的问题,也称为事实验证,在自然语言理解和语义表示的研究中发挥着重要作用。然而,现有的研究主要集中在处理非结构化证据(例如,自然语言句子和文档、新闻等),而基于结构化证据(如表格、图表和数据库)的事实验证则较少被探索。本文特别研究了以半结构化数据作为证据的事实验证问题。为此,我们构建了一个大规模的数据集TabFact,其中包含16000个维基百科表格作为118000个人工标注的自然语言陈述的证据,这些陈述被标记为蕴含(ENTAILMENT)或反驳(REFUTATION)。TabFact具有挑战性,因为它既涉及软性的语言推理,又涉及硬性的符号推理。为了应对这些推理挑战,我们设计了两种不同的模型:Table-BERT和潜在程序算法(Latent Program Algorithm, LPA)。Table-BERT利用最先进的预训练语言模型对表格和陈述进行线性化编码,并将其转换为连续向量以进行验证。LPA将陈述解析为程序,并在表格上执行这些程序以获得用于验证的二进制返回值。这两种方法达到了相似的准确性,但与人类的表现仍有较大差距。我们还进行了全面分析,展示了未来巨大的研究机会。该数据集的相关数据和代码可在\url{https://github.com/wenhuchen/Table-Fact-Checking}获取。
代码仓库
wenhuchen/Table-Fact-Checking
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| table-based-fact-verification-on-tabfact | Table-BERT-Horizontal-T+F-Template | Test: 65.12 Val: 66.1 |
| table-based-fact-verification-on-tabfact | BERT classifier w/o Table | Test: 50.5 Val: 50.9 |