4 个月前

面向更好的UD解析:深度上下文词嵌入、集成方法和树库拼接

面向更好的UD解析:深度上下文词嵌入、集成方法和树库拼接

摘要

本文描述了我们提交至CoNLL 2018共享任务“从原始文本到通用依存关系的多语言解析”中的系统(HIT-SCIR)。我们的提交基于斯坦福大学在CoNLL 2017共享任务中的获奖系统,并进行了两项有效的扩展:1)将深度上下文化的词嵌入(deep contextualized word embeddings)整合到词性标注器和解析器中;2)组合使用不同初始化训练的解析器。此外,我们还探讨了不同的树库连接方法以进一步提升性能。开发数据上的实验结果表明了我们方法的有效性。最终评估结果显示,我们的系统根据标签附着准确率(LAS)排名首位(75.84%),并且大幅领先其他系统。

代码仓库

基准测试

基准方法指标
dependency-parsing-on-universal-dependenciesHIT-SCIR
LAS: 75.84

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向更好的UD解析:深度上下文词嵌入、集成方法和树库拼接 | 论文 | HyperAI超神经