Command Palette
Search for a command to run...
词汇语义识别
词汇语义识别
Nelson F. Liu Daniel Hershcovich Michael Kranzlein Nathan Schneider
摘要
在词汇语义学中,全句切分与各类现象的片段标注通常被分别处理,尽管二者之间存在内在关联。我们提出假设:将多种标注风格统一为一项综合的词汇语义识别任务,是一种有效整合先前分散标注方式的方法,包括多词表达识别/分类以及超语义标注(supersense tagging)。基于STREUSLE语料库,我们训练了一个神经条件随机场(neural CRF)序列标注模型,并从多个标注维度评估其性能。由于该模型的标签体系扩展了以往任务(如PARSEME、DiMSUM)的标签集,我们进一步评估了模型在这些已有测试集上的泛化能力,结果表明,尽管模型仅在STREUSLE语料上进行训练,其性能仍能达到甚至超越现有模型。本研究还为词汇语义的集成化、精确建模建立了基线模型与评估指标,为该领域的后续研究提供了有力支持。