3 个月前

自上而下的篇章解析:基于序列标注的方法

自上而下的篇章解析:基于序列标注的方法

摘要

我们提出一种自顶向下的篇章分析方法,其概念上比先前的方法(Kobayashi 等,2020;Zhang 等,2020)更为简洁。通过将该任务建模为序列标注问题,旨在迭代地将文档分割为独立的篇章单元,我们得以省去解码器模块,并显著缩小分割点的搜索空间。我们在该任务中同时探索了传统的循环神经网络模型与现代预训练的 Transformer 模型,并进一步提出了一种新颖的动态最优标签(dynamic oracle)机制,用于支持自顶向下的解析过程。基于 Full 指标,我们提出的 LSTM 模型在 RST(语篇结构树)解析任务上达到了新的最先进水平。

代码仓库

基准测试

基准方法指标
discourse-parsing-on-rst-dtLSTM Dynamic
Standard Parseval (Full): 50.3
Standard Parseval (Nuclearity): 62.3
Standard Parseval (Relation): 51.5
Standard Parseval (Span): 73.1
discourse-parsing-on-rst-dtTransformer (dynamic)
Standard Parseval (Full): 49.2
Standard Parseval (Nuclearity): 60.1
Standard Parseval (Span): 70.2
discourse-parsing-on-rst-dtTransformer (static)
Standard Parseval (Full): 49.0
Standard Parseval (Nuclearity): 59.9
Standard Parseval (Relation): 50.6
Standard Parseval (Span): 70.6
discourse-parsing-on-rst-dtLSTM Static
Standard Parseval (Full): 49.4
Standard Parseval (Nuclearity): 61.7
Standard Parseval (Relation): 50.5
Standard Parseval (Span): 72.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
自上而下的篇章解析:基于序列标注的方法 | 论文 | HyperAI超神经