摘要
词义消歧(Word Sense Disambiguation, WSD)自引入自然语言处理(NLP)领域以来,始终是一项基础且持续研究的重要课题。其应用广泛,涵盖情感分析、信息检索(Information Retrieval, IR)、机器翻译以及知识图谱构建等多个方面。目前,WSD的解决方案主要分为监督式方法与基于知识的方法两大类。本文提出一种基于知识的方法,通过建模给定句子背后的语义空间与语义路径来解决该问题。该方法依托著名的知识库WordNet,分别利用潜在语义分析(Latent Semantic Analysis, LSA)与PageRank算法对语义空间和语义路径进行建模。实验结果验证了该方法的有效性,在多个WSD数据集上取得了当前最优(state-of-the-art)的性能表现。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| word-sense-disambiguation-on-knowledge-based | KEF | All: 68.0 SemEval 2007: 56.9 SemEval 2013: 68.4 SemEval 2015: 72.3 Senseval 2: 69.6 Senseval 3: 66.1 |