8 个月前

摘要

基于给定证据验证文本假设是否成立的问题，也称为事实验证，在自然语言理解和语义表示的研究中发挥着重要作用。然而，现有的研究主要集中在处理非结构化证据（例如，自然语言句子和文档、新闻等），而基于结构化证据（如表格、图表和数据库）的事实验证则较少被探索。本文特别研究了以半结构化数据作为证据的事实验证问题。为此，我们构建了一个大规模的数据集TabFact，其中包含16000个维基百科表格作为118000个人工标注的自然语言陈述的证据，这些陈述被标记为蕴含（ENTAILMENT）或反驳（REFUTATION）。TabFact具有挑战性，因为它既涉及软性的语言推理，又涉及硬性的符号推理。为了应对这些推理挑战，我们设计了两种不同的模型：Table-BERT和潜在程序算法（Latent Program Algorithm, LPA）。Table-BERT利用最先进的预训练语言模型对表格和陈述进行线性化编码，并将其转换为连续向量以进行验证。LPA将陈述解析为程序，并在表格上执行这些程序以获得用于验证的二进制返回值。这两种方法达到了相似的准确性，但与人类的表现仍有较大差距。我们还进行了全面分析，展示了未来巨大的研究机会。该数据集的相关数据和代码可在\url{https://github.com/wenhuchen/Table-Fact-Checking}获取。

源 PDF