
摘要
生成方法通过以指定格式生成一系列情感元素,极大地促进了基于方面的情感分析。然而,现有的研究通常以固定顺序预测情感元素,这忽略了情感元组中各元素之间的相互依赖关系以及语言表达多样性对结果的影响。在本工作中,我们提出了一种多视图提示(Multi-view Prompting, MvP)方法,该方法聚合了以不同顺序生成的情感元素,借鉴了从不同视角进行类人问题求解过程的直觉。具体而言,MvP 引入了元素顺序提示,引导语言模型生成多个情感元组,每个元组具有不同的元素顺序,然后通过投票选择最合理的情感元组。MvP 可以自然地建模多视图和多任务,分别作为元素的排列组合,使用单个模型在多个基于方面的情感分析(ABSA)任务上超越了以往的任务特定设计方法。广泛的实验表明,MvP 在4个基准任务的10个数据集上显著提升了最先进的性能,并且在低资源设置下表现非常有效。详细的评估验证了 MvP 的有效性、灵活性和跨任务迁移能力。
代码仓库
ZubinGou/multi-view-prompting
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| aspect-based-sentiment-analysis-absa-on-acos | ChatGPT (gpt-3.5-turbo, few-shot) | F1 (Restaurant): 37.71 |
| aspect-based-sentiment-analysis-absa-on-acos | MvP (muilti-task) | F1 (Laptop): 43.84 F1 (Restaurant): 60.36 |
| aspect-based-sentiment-analysis-absa-on-acos | ChatGPT (gpt-3.5-turbo, zero-shot) | F1 (Restaurant): 27.11 |
| aspect-based-sentiment-analysis-absa-on-acos | MvP | F1 (Laptop): 43.92 F1 (Restaurant): 61.54 |
| aspect-based-sentiment-analysis-absa-on-asqp | ChatGPT (gpt-3.5-turbo, few-shot) | F1 (R15): 34.27 |
| aspect-based-sentiment-analysis-absa-on-asqp | MvP (multi-task) | F1 (R15): 52.21 F1 (R16): 58.94 |
| aspect-based-sentiment-analysis-absa-on-asqp | ChatGPT (gpt-3.5-turbo, zero-shot) | F1 (R15): 22.87 |
| aspect-based-sentiment-analysis-absa-on-asqp | MvP | F1 (R15): 51.04 F1 (R16): 60.39 |
| aspect-based-sentiment-analysis-absa-on-aste | MvP (multi-task) | F1 (L14): 65.30 F1 (R15): 69.44 F1 (R16): 73.10 F1(R14): 76.30 |
| aspect-based-sentiment-analysis-absa-on-aste | ChatGPT (gpt-3.5-turbo, few-shot) | F1 (L14): 38.12 |
| aspect-based-sentiment-analysis-absa-on-aste | ChatGPT (gpt-3.5-turbo, zero-shot) | F1 (L14): 36.05 |
| aspect-based-sentiment-analysis-absa-on-aste | MvP | F1 (L14): 63.33 F1 (R15): 65.89 F1 (R16): 73.48 F1(R14): 74.05 |
| aspect-based-sentiment-analysis-absa-on-tasd | MvP (multi-task) | F1 (R15): 64.74 F1 (R16): 70.18 |
| aspect-based-sentiment-analysis-absa-on-tasd | ChatGPT (gpt-3.5-turbo, zero-shot) | F1 (R16): 34.08 |
| aspect-based-sentiment-analysis-absa-on-tasd | MvP | F1 (R15): 64.53 F1 (R16): 72.76 |
| aspect-based-sentiment-analysis-absa-on-tasd | ChatGPT (gpt-3.5-turbo, few-shot) | F1 (R16): 46.51 |