4 个月前

TabFact:一个大规模的表格事实验证数据集

TabFact:一个大规模的表格事实验证数据集

摘要

基于给定证据验证文本假设是否成立的问题,也称为事实验证,在自然语言理解和语义表示的研究中发挥着重要作用。然而,现有的研究主要集中在处理非结构化证据(例如,自然语言句子和文档、新闻等),而基于结构化证据(如表格、图表和数据库)的事实验证则较少被探索。本文特别研究了以半结构化数据作为证据的事实验证问题。为此,我们构建了一个大规模的数据集TabFact,其中包含16000个维基百科表格作为118000个人工标注的自然语言陈述的证据,这些陈述被标记为蕴含(ENTAILMENT)或反驳(REFUTATION)。TabFact具有挑战性,因为它既涉及软性的语言推理,又涉及硬性的符号推理。为了应对这些推理挑战,我们设计了两种不同的模型:Table-BERT和潜在程序算法(Latent Program Algorithm, LPA)。Table-BERT利用最先进的预训练语言模型对表格和陈述进行线性化编码,并将其转换为连续向量以进行验证。LPA将陈述解析为程序,并在表格上执行这些程序以获得用于验证的二进制返回值。这两种方法达到了相似的准确性,但与人类的表现仍有较大差距。我们还进行了全面分析,展示了未来巨大的研究机会。该数据集的相关数据和代码可在\url{https://github.com/wenhuchen/Table-Fact-Checking}获取。

代码仓库

wenhuchen/Table-Fact-Checking
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
table-based-fact-verification-on-tabfactTable-BERT-Horizontal-T+F-Template
Test: 65.12
Val: 66.1
table-based-fact-verification-on-tabfactBERT classifier w/o Table
Test: 50.5
Val: 50.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TabFact:一个大规模的表格事实验证数据集 | 论文 | HyperAI超神经