
摘要
尽管时间标记仍主要由基于规则的系统主导,但最近已有尝试开发神经网络时间标记器。然而,所有这些尝试都集中在单语言环境中。本文探讨了多语言方法在文本中提取时间表达式的技术,并研究了对抗训练以将嵌入空间对齐到一个共同的空间。通过这种方法,我们创建了一个单一的多语言模型,该模型还可以迁移到未见过的语言,并在跨语言迁移实验中树立了新的技术标杆。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| temporal-tagging-on-basque-timebank | Lange et al. | F1: 47.87 |
| temporal-tagging-on-catalan-timebank-1-0 | Lange et al. | F1: 64.21 |
| temporal-tagging-on-french-timebank | Lange et al. | F1: 62.58 |
| temporal-tagging-on-krauts | Lange et al. | F1: 66.53 |
| temporal-tagging-on-spanish-timebank-1-0 | Lange et al. | F1: 79.55 |
| temporal-tagging-on-tempeval-3 | Lange et al. | F1: 74.8 |
| temporal-tagging-on-timebankpt | Lange et al. | F1: 75.47 |