
摘要
本文提出了一种简洁而有效的词语义消歧模型。我们的方法利用了一个在所有词汇之间共享的双向长短期记忆网络(bidirectional long short-term memory network)。这使得模型能够共享统计强度,并且随着词汇量的增加具有良好扩展性。该模型从原始文本直接训练到词义标签,端到端地进行训练,并有效利用了词序信息。我们在两个标准数据集上评估了该方法,使用相同的超参数设置,这些超参数是在第三个保留的数据集上调整得到的。我们没有使用任何外部资源(例如知识图谱、词性标注等)、语言特定特征或手工编写的规则,但仍达到了与最佳现有系统相当的统计效果,这些系统也没有类似的限制。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| word-sense-disambiguation-on-senseval-2-1 | BiLSTM with GloVe | F1: 66.9 |
| word-sense-disambiguation-on-senseval-3 | BiLSTM with GloVe | F1: 73.4 |