
摘要
本文介绍了我们在语义网挑战赛(Semantic Web Challenge)“表格数据到知识图谱匹配”(SemTab)准确性赛道中的贡献。该贡献提出了一种基于知识图谱精炼的表格数据标注方法。在该方法中,内部方法用于预测表格中单元格之间的关联关系,而外部方法则用于预测缺失的实体与关系。该方法分别应用于HardTables和ToughTables的标注,采用DBpedia和Wikidata作为知识源;同时,也应用于GitTables和BiodivTab的标注,使用DBpedia和Schema.org作为知识源。在比赛的第三轮中,我们在GitTables和BiodivTab的标注任务中分别取得了第三名和第二名的成绩。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| cell-entity-annotation-on-biodivtab | TSOTSA | F1 (%): 79 |
| column-type-annotation-on-biodivtab | TSOTSA | F1 (%): 76 |