HyperAIHyperAI

Command Palette

Search for a command to run...

WiC-TSV:面向上下文词义验证的评估基准

Anna Breit Artem Revenko Kiamehr Rezaee Mohammad Taher Pilehvar Jose Camacho-Collados

摘要

我们提出了WiC-TSV,这是一个面向词义消歧(Word Sense Disambiguation)的新一代多领域评估基准。具体而言,我们引入了一种面向上下文中的目标词义验证(Target Sense Verification of Words in Context)的框架,其独特性体现在将任务建模为二分类问题,因而不依赖外部词义词典(sense inventories),同时覆盖了多种领域。这一设计使该数据集在评估跨领域及不同类型的模型与系统时具有高度灵活性。WiC-TSV提供了三种不同的评估设置,依据输入信号的类型而定。我们基于当前最先进的语言模型在该数据集上设立了基线性能。实验结果表明,尽管这些模型在该任务上表现尚可,但在跨领域(out-of-domain)场景下,机器性能与人类表现之间仍存在显著差距。WiC-TSV数据集可于 https://competitions.codalab.org/competitions/23683 获取。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供