
摘要
开放信息抽取(OpenIE)有助于从大型语料库中进行领域无关的关系事实发现。该技术非常适合许多开放世界的自然语言理解场景,例如自动知识库构建、开放域问答和显式推理。得益于深度学习技术的快速发展,已经提出了多种神经网络OpenIE架构,并取得了显著的性能提升。在本综述中,我们对当前最先进的神经网络OpenIE模型进行了广泛的概述,分析了它们的关键设计决策、优势和劣势。随后,我们讨论了现有解决方案的局限性和OpenIE问题本身存在的开放性问题。最后,我们列出了最近的趋势,这些趋势可能有助于扩展其应用范围和适用性,为未来的OpenIE研究指明了有前景的方向。据我们所知,这是第一篇针对这一特定主题的综述文章。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| open-information-extraction-on-carb | SpanOIE [48] | F1: 48.5 |
| open-information-extraction-on-carb | ClausIE [9] | F1: 45 |
| open-information-extraction-on-carb | OpenIE6 | F1: 52.7 |
| open-information-extraction-on-carb | OpenIE4 | F1: 51.6 |
| open-information-extraction-on-carb | IMoJIE | F1: 53.3 |
| open-information-extraction-on-carb | NOIE | F1: 51.1 |
| open-information-extraction-on-carb | MacroIE | F1: 54.8 |
| open-information-extraction-on-carb | RnnOIE | F1: 49 |
| open-information-extraction-on-carb | Multi2OIE | F1: 52.3 |
| open-information-extraction-on-carb | SenseOIE [30] | F1: 28.2 |
| open-information-extraction-on-oie2016 | RnnOIE [36] | F1: 62 |
| open-information-extraction-on-oie2016 | ClausIE [9] | F1: 59 |
| open-information-extraction-on-oie2016 | OpenIE4 [26] | F1: 60 |
| open-information-extraction-on-oie2016 | SpanOIE [48] | F1: 69.4 |