4 个月前

野生语篇连贯性:一个数据集、评估和方法

野生语篇连贯性:一个数据集、评估和方法

摘要

迄今为止,针对真实世界数据的篇章连贯性方法评估工作非常有限。为了解决这一问题,我们介绍了一个新的真实世界文本语料库(GCDC)以及首次对领先篇章连贯性算法进行的大规模评估。研究结果表明,神经模型,包括我们在此提出的两种新模型(SentAvg 和 ParSeq),通常表现最佳。我们分析了这些性能差异,并讨论了在四个领域中观察到的低连贯性文本模式。

代码仓库

基准测试

基准方法指标
coherence-evaluation-on-gcdc-rst-accuracyParSeq
Accuracy: 55.09
coherence-evaluation-on-gcdc-rst-f1ParSeq
Average F1: 46.65

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
野生语篇连贯性:一个数据集、评估和方法 | 论文 | HyperAI超神经