6 个月前

摘要

少样本序列标注（Few-Shot Sequence Labeling, FSSL）是标签模型（如命名实体识别和槽位填充）在新兴、资源稀缺领域中实现泛化的一种典型范式。近年来，基于度量的元学习框架被广泛认为是解决FSSL问题的一种有前景的方法。然而，大多数现有方法基于词元级别的相似性为每个词元分配标签，忽略了命名实体或槽位的整体性特征。针对这一问题，本文提出了一种增强的基于跨度的分解方法——ESD（Enhanced Span-based Decomposition），用于FSSL任务。ESD将FSSL建模为测试查询与支持实例之间的跨度级别匹配问题。具体而言，ESD将跨度匹配过程分解为一系列跨度级别的操作，主要包括：增强的跨度表示、类别原型聚合以及跨度冲突的解决。大量实验表明，ESD在两个主流FSSL基准数据集FewNERD和SNIPS上均取得了新的最先进性能，并在嵌套标注和噪声标注场景下展现出更强的鲁棒性。相关代码已开源，地址为：https://github.com/Wangpeiyi9979/ESD。

源 PDF