3 个月前

图尔库神经解析流水线:面向CoNLL 2018共享任务的端到端系统

图尔库神经解析流水线:面向CoNLL 2018共享任务的端到端系统

摘要

本文介绍了图尔库自然语言处理(TurkuNLP)团队在2018年CoNLL共享任务——“从原始文本到通用依存句法(Universal Dependencies)的多语言句法分析”中的参赛方案。与去年相比,本届共享任务新增了两项主要评估指标,用于衡量形态标注(morphological tagging)和词形还原(lemmatization)的准确率,除原有的句法树结构评估外,形成了更全面的评价体系。基于对这些新指标的重视,我们设计并实现了一套端到端的句法分析流水线,特别聚焦于开发一种新颖且处于当前最先进水平的词形还原模块。在参与的26支队伍中,我们的系统在三项主要指标上取得了最高综合排名:在词形还原相关指标中获得第一名,在形态标注和句法分析两项指标中均位列第二。

基准测试

基准方法指标
dependency-parsing-on-universal-dependenciesTurkuNLP
BLEX: 66.09
LAS: 73.28
UAS: 60.99

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
图尔库神经解析流水线:面向CoNLL 2018共享任务的端到端系统 | 论文 | HyperAI超神经