
摘要
结构化知识接地(Structured Knowledge Grounding, SKG)利用结构化知识来完成用户请求,例如数据库上的语义解析和知识库上的问题回答。由于SKG任务的输入和输出具有异质性,不同的研究社区对其进行了独立的研究,这限制了系统性和兼容性的SKG研究。在本文中,我们通过提出UnifiedSKG框架克服了这一局限性,该框架将21个SKG任务统一为文本到文本的格式,旨在促进系统性的SKG研究,而不是局限于单一任务、领域或数据集。我们使用UnifiedSKG对不同规模的T5模型进行基准测试,并显示经过必要时的简单修改,T5在几乎所有21个任务上都达到了最先进的性能。我们进一步证明了多任务前缀调优可以提高大多数任务的性能,显著提升了整体表现。UnifiedSKG还促进了零样本和少样本学习的研究,我们展示了T0、GPT-3和Codex在零样本和少样本学习中的SKG任务上表现不佳。此外,我们还使用UnifiedSKG对跨SKG任务的各种结构化知识编码变体进行了系列受控实验。UnifiedSKG易于扩展到更多任务,并且其源代码已开源至https://github.com/hkunlp/unifiedskg。
代码仓库
hkunlp/unifiedskg
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semantic-parsing-on-wikitablequestions | T5-3b(UnifiedSKG) | Accuracy (Dev): 50.65 Accuracy (Test): 49.29 |
| table-based-fact-verification-on-tabfact | T5-3b(UnifiedSKG) | Test: 83.68 Val: 83.97 |
| task-oriented-dialogue-systems-on-kvret | T5-3b(UnifiedSKG) | Entity F1: 70.07 |