3 个月前

实体对齐前沿技术的批判性评估

实体对齐前沿技术的批判性评估

摘要

在本项研究中,我们对知识图谱实体对齐任务中两种当前最先进的(State-of-the-Art, SotA)方法进行了系统而深入的考察。为此,我们首先对基准测试流程进行了细致分析,识别出若干缺陷,这些缺陷导致原始研究中报告的结果往往难以进行有效比较。此外,我们怀疑在该领域中普遍存在一种现象:直接在测试集上进行超参数优化,这显著降低了所报告性能指标的可信度与信息价值。为此,我们选取了具有代表性的基准数据集样本,并详细描述了它们的特性。同时,我们还考察了实体表示的不同初始化方式,因为这一因素对模型性能具有决定性影响。为了确保评估的公平性,我们采用统一的训练/验证/测试集划分策略,使所有方法在所有数据集上均在相同条件下进行评估。在实验评估中,我们获得了若干有趣的发现:尽管大多数情况下SotA方法的表现优于基线方法,但当数据集包含噪声时,其性能显著下降——而这正是大多数真实应用场景的典型特征。此外,通过消融实验我们发现,相较于以往的假设,SotA方法中某些特定组件或特征对取得良好性能起到了更为关键的作用。相关代码已公开,可访问:https://github.com/mberr/ea-sota-comparison。

代码仓库

mberr/ea-sota-comparison
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
entity-alignment-on-dbp15k-fr-enZero Shot
Hits@1: 0.8370
entity-alignment-on-dbp15k-ja-enZero Shot
Hits@1: 0.6564
entity-alignment-on-dbp15k-zh-enZero Shot
Hits@1: 0.594
entity-alignment-on-dbp15k-zh-enRDGCN
Hits@1: 0.6954

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供