
摘要
本研究探讨了朴素贝叶斯分类器在知识图谱与表格数据匹配中的应用,重点关注列类型标注(Column Type Annotation)、单元格实体标注(Cell Entity Annotation)、列属性标注(Column Property Annotation)以及表格主题检测(Table Topic Detection)等任务。通过采用共现次数、词频等特征提取技术,研究在多种数据集上评估了朴素贝叶斯分类器的有效性与性能表现。所提出的方法具有简洁性与通用性,为知识图谱匹配领域做出了贡献,并展示了朴素贝叶斯分类器在表格数据与知识图谱集成及互操作性方面的潜在价值。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| column-type-annotation-on-wdc-sotab-v2 | TSOTSA | Micro F1: 37.05 |
| columns-property-annotation-on-wdc-sotab-v2 | TSOTSA | Micro F1: 23.55 |