
摘要
本文介绍了我们参与2019年BioNLP共享任务中“细菌生境”(Bacteria Biotope Task)的成果。我们的参与涵盖该任务的两个子任务:实体标准化(BB-norm)与基于生物医学文本的实体间关系识别(BB-rel)。在实体标准化任务中,我们采用词嵌入(word embeddings)与句法重排序(syntactic re-ranking)相结合的方法;在关系抽取任务中,则采用预定义规则进行处理。尽管两种方法均属于无监督学习范式(即无需依赖标注数据),但均取得了令人满意的效果。尤其在BB-norm任务中,实验结果表明,所提出的方法性能可与依赖标注数据的深度学习方法相媲美。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-concept-normalization-on-bb-norm-1 | BOUN-ISIK | accuracy: 0.428 wang: 0.687 |
| medical-concept-normalization-on-bb-norm-2 | BOUN-ISIK | accuracy: 0.315 wang: 0.566 |