4 个月前

双向LSTM-CRF模型用于序列标注

双向LSTM-CRF模型用于序列标注

摘要

在本文中,我们提出了一系列基于长短期记忆网络(LSTM)的序列标注模型。这些模型包括LSTM网络、双向LSTM(BI-LSTM)网络、带有条件随机场(CRF)层的LSTM网络(LSTM-CRF)以及带有CRF层的双向LSTM网络(BI-LSTM-CRF)。我们的研究首次将双向LSTM条件随机场模型(记作BI-LSTM-CRF)应用于自然语言处理基准序列标注数据集。我们展示了该模型由于具备双向LSTM组件,能够高效利用过去和未来的输入特征;同时,由于CRF层的存在,它还能够利用句子级别的标签信息。实验结果表明,BI-LSTM-CRF模型在词性标注(POS)、分块(chunking)和命名实体识别(NER)数据集上能够达到或接近当前最佳的准确率。此外,该模型具有较强的鲁棒性,并且对词嵌入的依赖程度较低,这与之前的观察结果相比有所改进。

代码仓库

基准测试

基准方法指标
chunking-on-penn-treebankBI-LSTM-CRF (Senna) (ours)
F1 score: 94.46
named-entity-recognition-on-findvehicleBiLSTM-CRF
F1 Score: 49.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供