3 个月前

ADAPT 参与 SemEval-2018 任务 9:基于跳字模型的词嵌入在专业语料库中的无监督上位词发现

ADAPT 参与 SemEval-2018 任务 9:基于跳字模型的词嵌入在专业语料库中的无监督上位词发现

摘要

本文介绍了一种简单但具有竞争力的无监督上下位词(hypernym)发现系统。该系统采用带有负采样的skip-gram词向量模型,并在特定领域语料库上进行训练。对于输入词语,系统基于余弦相似度得分预测其候选上下位词。我们分别在两个特定领域语料库——医学语料库和音乐产业语料库上独立训练了两组词向量模型。在与其他无监督系统对比时,该系统在医学领域表现最优,但在音乐产业领域表现较差。该系统仅依赖原始的特定领域语料库,不需任何外部数据支持。

基准测试

基准方法指标
hypernym-discovery-on-medical-domainADAPT
MAP: 8.13
MRR: 20.56
P@5: 8.32
hypernym-discovery-on-music-domainADAPT
MAP: 2.63
MRR: 7.46
P@5: 2.64

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ADAPT 参与 SemEval-2018 任务 9:基于跳字模型的词嵌入在专业语料库中的无监督上位词发现 | 论文 | HyperAI超神经