
摘要
实体归一化是一项重要的信息抽取任务,近年来在生物医学与生命科学领域重新受到广泛关注。在这些领域,以及更广泛的专业领域中,该任务对最新的基于机器学习的方法而言仍具挑战性,主要原因是这些方法在处理高度多类且少样本学习问题时表现不佳。为应对这一挑战,我们提出了一种名为 C-Norm 的新型神经网络方法,该方法通过协同整合标准监督、弱监督、本体知识与分布语义,有效提升了实体归一化的性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-concept-normalization-on-bb-norm-1 | C-Norm | accuracy: 0.604 wang: 0.777 |
| medical-concept-normalization-on-bb-norm-2 | C-Norm | accuracy: 0.700 wang: 0.881 |