
摘要
实体对齐(Entity Alignment, EA)是一项基础的数据集成任务,旨在识别不同知识图谱(Knowledge Graphs, KGs)之间的等价实体。时间知识图谱(Temporal Knowledge Graphs, TKGs)通过引入时间戳扩展了传统知识图谱,近年来受到越来越多关注。当前先进的时序感知EA研究指出,TKG中的时序信息有助于提升EA的性能。然而,现有研究尚未充分挖掘TKG中时序信息的优势,且通常依赖于预先对齐的实体对进行EA,这一过程往往耗时耗力,效率较低。本文提出DualMatch,一种能够有效融合关系与时序信息的实体对齐方法。DualMatch将TKG上的实体对齐问题转化为加权图匹配问题。具体而言,DualMatch采用一种无监督方法,无需依赖种子对齐(seed alignment)即可完成实体对齐。该方法包含两个核心步骤:(i)利用一种新颖的无标签编码器——Dual-Encoder,分别对时序信息与关系信息进行编码,生成嵌入表示;(ii)通过一种基于图匹配的新颖解码器——GM-Decoder,融合两类信息并转化为最终的实体对齐结果。得益于其对时序信息的高效捕捉能力,DualMatch能够在有监督与无监督两种场景下均实现有效的TKG实体对齐。在三个真实世界TKG数据集上的大量实验表明,与当前最先进方法相比,DualMatch在H@1指标上提升2.4%至10.7%,在MRR指标上提升1.7%至7.6%,充分验证了其优越性与有效性。
代码仓库
zju-daily/dualmatch
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| entity-alignment-on-dicews-1k | DualMatch | Hit@1: 95.3 |
| entity-alignment-on-yago-wiki50k | DualMatch | Hit@1: 98.1 |