
摘要
目前,大量结构化数据尚未充分受益于语义网技术。为此,国际语义网会议(ISWC)举办的“表格数据到知识图谱匹配”竞赛旨在通过评估与推动相关语义标注工具的开发,弥合这一差距。除了实现数据的语义标注外,系统还应能够基于已有的标注信息进一步扩充数据集。本文提出一种新系统,该系统利用可解释的嵌入技术INK,兼具数据标注与数据增强能力。本文通过“表格数据到知识图谱匹配”竞赛对所提系统的标注性能进行了评估。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| cell-entity-annotation-on-biodivtab | MAGIC | F1 (%): 10 |
| cell-entity-annotation-on-toughtables-dbp | MAGIC | F1 (%): 18.4 |
| column-type-annotation-on-biodivtab | MAGIC | F1 (%): 14.2 |
| column-type-annotation-on-toughtables-dbp | MAGIC | F1 (%): 15.9 |