
摘要
尽管多主体对话通常比独白或文档类文本结构更为松散,但其内在仍通过交互轮次之间的语义层级相关性实现隐式组织。因此,可运用对话话语分析方法预测基本话语单元之间的依赖结构与语义关系,为下游任务提供丰富结构化特征信息。然而,现有具备对话话语标注的语料库大多来源于特定领域,且样本量有限,导致基于数据驱动的方法在缺乏领域适应的情况下,对新领域对话的性能表现不佳。本文首先提出一种基于Transformer的解析器,并评估其跨领域表现。随后,从数据与语言建模两个角度出发,采用三种方法实现领域融合,以提升模型的泛化能力。实验结果表明,神经解析器能够从所提出的改进方法中获益,在跨领域对话样本上的表现显著优于基线方法。
代码仓库
seq-to-mind/DDP_parsing
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| discourse-parsing-on-molweni | Hierarchical | Link u0026 Rel F1: 56.1 Link F1: 80.1 |
| discourse-parsing-on-stac | Hierarchical | Link u0026 Rel F1: 57.2 Link F1: 75.5 |