4 个月前

跨语言上下文词嵌入对齐及其在零样本依存句法分析中的应用

跨语言上下文词嵌入对齐及其在零样本依存句法分析中的应用

摘要

我们提出了一种利用深度上下文嵌入(contextual embeddings)进行多语言迁移的新方法,这些嵌入以无监督的方式预训练。尽管上下文嵌入已被证明在表示意义方面比静态嵌入更为丰富,但由于其动态特性,对齐它们仍是一个挑战。为此,我们构建了原始单语空间的上下文无关变体,并利用它们之间的映射来推导上下文相关空间的对齐。这种映射可以支持目标语言的处理,通过上下文感知嵌入提高迁移效果。实验结果表明,该方法在零样本学习和少样本学习的依存句法分析中具有有效性。具体而言,我们的方法在6种测试语言上始终优于先前的最先进方法,平均提高了6.8个LAS分数点。

代码仓库

TalSchuster/CrossLingualELMo
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
cross-lingual-zero-shot-dependency-parsing-onCross-Lingual ELMo
LAS: 77.3
UAS: 84.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
跨语言上下文词嵌入对齐及其在零样本依存句法分析中的应用 | 论文 | HyperAI超神经