3 个月前

PENELOPIE:通过机器翻译实现希腊语的开放信息抽取

PENELOPIE:通过机器翻译实现希腊语的开放信息抽取

摘要

本文介绍了我们提交至EACL 2021 SRW的成果,提出了一种旨在弥合开放信息抽取(Open Information Extraction, OIE)领域中高资源语言与低资源语言之间差距的方法,并以希腊语为例进行展示。本文的研究目标包含两个方面:首先,基于Transformer架构构建英-希和希-英神经机器翻译(Neural Machine Translation, NMT)模型;其次,利用这些NMT模型将希腊语文本翻译为英文,作为我们自然语言处理(NLP)流水线的输入,并在此基础上执行一系列预处理及三元组抽取任务;最后,将提取出的三元组进行反向翻译,重新转换回希腊语。我们在基准数据集上对所提出的NMT与OIE方法进行了评估,结果表明,该方法在希腊语自然语言处理任务中优于当前最先进的技术水平。

代码仓库

基准测试

基准方法指标
machine-translation-on-tatoeba-el-to-enPENELOPIE (Transformers-based Greek-to-English NMT)
BLEU: 79.3
machine-translation-on-tatoeba-en-to-elPENELOPIE Transformers-based NMT (EN2EL)
BLEU: 76.9
open-information-extraction-on-carb-oiePENELOPIE Greek OIE
F1: 0.255

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PENELOPIE:通过机器翻译实现希腊语的开放信息抽取 | 论文 | HyperAI超神经