
摘要
近年来,方面级情感四元组预测(Aspect Sentiment Quad Prediction, ASQP)已成为方面级情感分析领域的一项热门任务。以往的研究通常采用预定义的模板,将原始句子改写为结构化的目标序列,从而可被模型轻松解码为形式为(方面类别,方面词,观点词,情感极性)的四元组。这些模板中的四个元素以固定顺序排列。然而,我们观察到,这种方案与ASQP任务的“顺序无关”特性相悖——只要能够正确提取出四元组,其内部元素的顺序并不应被强制固定。受此启发,我们系统研究了模板顺序对模型性能的影响,发现某些特定顺序有助于生成式模型取得更优表现。我们推测,不同的顺序为四元组提供了多样化的表达视角。基于这一发现,我们提出了一种简单而有效的方法,用于识别最合适的模板顺序,并进一步将多个最优模板作为数据增强手段,以提升ASQP任务的性能。具体而言,我们利用预训练语言模型筛选出信息熵最小的模板顺序。通过在这些模板顺序上对预训练模型进行微调,我们的方法显著提升了四元组预测的性能,并在低资源场景下显著超越了现有最先进方法。
代码仓库
hmt2014/aspectquad
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| aspect-based-sentiment-analysis-absa-on-acos | DLO | F1 (Laptop): 43.64 F1 (Restaurant): 59.99 |
| aspect-based-sentiment-analysis-absa-on-asqp | DLO | F1 (R15): 48.18 F1 (R16): 59.79 |
| aspect-based-sentiment-analysis-absa-on-aste | DLO | F1 (L14): 61.46 F1 (R15): 64.26 F1 (R16): 73.03 F1(R14): 72.39 |
| aspect-based-sentiment-analysis-absa-on-tasd | DLO | F1 (R15): 62.95 F1 (R16): 71.79 |