
摘要
方面情感四元组预测(Aspect Sentiment Quad Prediction, ASQP)旨在从文本中识别方面项(aspect terms)、观点项(opinion terms)、情感极性(sentiment polarity)以及方面类别(aspect categories)。该任务面临的一个主要挑战是由于标注成本高昂导致的数据稀缺问题。为缓解这一问题,数据增强技术被广泛采用。然而,现有方法通常仅对训练数据中的文本进行简单改写,导致生成数据的语义多样性受限,且因文本与四元组之间的一致性不足而影响了数据质量。针对上述局限,本文提出通过增强四元组并训练一个“四元组到文本”的生成模型,以生成与之对应的新文本。此外,我们设计了新颖的数据过滤策略,有效剔除低质量样本,并对增强数据集中的样本难度分布进行平衡。在两个ASQP基准数据集上的实证研究结果表明,所提方法优于现有的各类数据增强方法,并在多个基准测试中达到了当前最优(state-of-the-art)性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| aspect-based-sentiment-analysis-absa-on-asqp | AugABSA | F1 (R15): 50.01 F1 (R16): 60.88 |
| aspect-based-sentiment-analysis-absa-on-aste | AugABSA | F1 (L14): 62.66 F1 (R15): 65.80 F1 (R16): 74.23 F1(R14): 73.76 |