
摘要
本文介绍了KGCODE-Tab在2022年SemTab表格数据到知识图谱匹配竞赛中的实验结果。作为一项高效的表格数据链接系统,KGCODE-Tab旨在参与本次竞赛的三项任务:列类型标注(Column Type Annotation, CTA)、单元格实体标注(Cell Entity Annotation, CEA)以及列属性标注(Columns Property Annotation, CPA)。本文将简要介绍KGCODE-Tab所采用的关键技术,并对其优势与局限性进行分析与讨论。
基准测试
| 基准 | 方法 | 指标 | 
|---|---|---|
| cell-entity-annotation-on-biodivtab | KGCODE-Tab | F1 (%): 91.1 | 
| cell-entity-annotation-on-toughtables-dbp | KGCODE-Tab | F1 (%): 82.7 | 
| column-type-annotation-on-biodivtab | KGCODE-Tab | F1 (%): 86.7 | 
| column-type-annotation-on-gittables-semtab | KGCODE-Tab | F1 (%): 58.7 | 
| column-type-annotation-on-gittables-semtab-1 | KGCODE-Tab | F1 (%): 69.3 | 
| column-type-annotation-on-toughtables-dbp | KGCODE-Tab | F1 (%): 48 | 
| column-type-annotation-on-toughtables-wd | KGCODE-Tab | F1 (%): 54.3 |