
摘要
在单一消息流中拆分交织在一起的对话是一项艰巨的任务,这一任务因缺乏大规模人工标注的数据集而变得更加困难。我们创建了一个新的数据集,包含77,563条人工标注的消息,这些消息通过回复结构图不仅拆分了对话,还定义了对话的内部结构。我们的数据集比之前所有发布的数据集总和大16倍,是首个包含注释分歧裁决的数据集,也是首个包含上下文的数据集。我们利用这些数据重新审视了先前的研究工作,特别是发现,在一个广泛使用的对话语料库中,80%的对话要么缺少消息,要么包含多余的消息。我们的人工标注数据为开发稳健的数据驱动方法以实现对话拆分提供了机会,这将有助于推动对话研究的发展。
代码仓库
IBM/dstc-noesis
tf
GitHub 中提及
IBM/dstc7-noesis
tf
GitHub 中提及
jkkummerfeld/irc-disentanglement
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| conversation-disentanglement-on-irc | FF ensemble: Intersect | 1-1: 26.6 F: 32.1 P: 67.0 R: 21.1 VI: 69.3 |
| conversation-disentanglement-on-irc | Feedforward | 1-1: 75.6 F: 36.2 P: 34.6 R: 38.0 VI: 91.3 |
| conversation-disentanglement-on-irc | FF ensemble: Vote | 1-1: 76.0 F: 38.0 P: 36.3 R: 39.7 VI: 91.5 |
| conversation-disentanglement-on-linux-irc-ch2 | Linear | 1-1: 59.7 |
| conversation-disentanglement-on-linux-irc-ch2-1 | Feedforward | 1-1: 52.1 Local: 77.8 Shen F-1: 53.8 |