
摘要
机器阅读理解中处理不可回答的问题是自然语言处理领域的一个新挑战。一个关键的子任务是可靠地预测问题是否可回答。在本文中,我们提出了一种统一模型,称为U-Net,该模型包含三个重要组件:答案指针、无答案指针和答案验证器。我们引入了一个通用节点,从而将问题及其上下文段落作为单一连续的标记序列进行处理。通用节点编码了来自问题和段落的融合信息,在预测问题是否可回答方面发挥着重要作用,并显著提高了U-Net的简洁性。与最先进的流水线模型不同,U-Net可以以端到端的方式进行学习。在SQuAD 2.0数据集上的实验结果表明,U-Net能够有效预测问题的不可回答性,并在SQuAD 2.0上取得了71.7的F1分数。
代码仓库
FudanNLP/UNet
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| question-answering-on-squad20 | Unet (ensemble) | EM: 71.417 F1: 74.869 |
| question-answering-on-squad20-dev | U-Net | EM: 70.3 F1: 74.0 |