
摘要
在本文中,我们提出了一系列基于长短期记忆网络(LSTM)的序列标注模型。这些模型包括LSTM网络、双向LSTM(BI-LSTM)网络、带有条件随机场(CRF)层的LSTM网络(LSTM-CRF)以及带有CRF层的双向LSTM网络(BI-LSTM-CRF)。我们的研究首次将双向LSTM条件随机场模型(记作BI-LSTM-CRF)应用于自然语言处理基准序列标注数据集。我们展示了该模型由于具备双向LSTM组件,能够高效利用过去和未来的输入特征;同时,由于CRF层的存在,它还能够利用句子级别的标签信息。实验结果表明,BI-LSTM-CRF模型在词性标注(POS)、分块(chunking)和命名实体识别(NER)数据集上能够达到或接近当前最佳的准确率。此外,该模型具有较强的鲁棒性,并且对词嵌入的依赖程度较低,这与之前的观察结果相比有所改进。
代码仓库
JZ-LIANG/CRF-LSTM-NER
tf
GitHub 中提及
akshay-gupta123/BI-LSTM-CRF_Tensorflow
tf
GitHub 中提及
ngoquanghuy99/POS-Tagging-BiLSTM-CRF
tf
GitHub 中提及
determined22/zh-ner-tf
tf
GitHub 中提及
aonotas/deep-crf
GitHub 中提及
UcasLzz/ChineseWordSeg-POS
GitHub 中提及
sumehta/bilstm_crf_extract
pytorch
GitHub 中提及
baiyang2464/chatbot-base-on-Knowledge-Graph
tf
GitHub 中提及
DimasDMM/diseases-ner
GitHub 中提及
kyzhouhzau/CCLNER
tf
GitHub 中提及
guillaumegenthial/tf_ner
tf
GitHub 中提及
sarveshsparab/BiLSTMCRFSeqTag
tf
GitHub 中提及
UcasLzz/CWS
tf
GitHub 中提及
zysite/post
pytorch
GitHub 中提及
gxzzz/bilstm-crf
pytorch
GitHub 中提及
GlassyWing/bi-lstm-crf
GitHub 中提及
jidasheng/bi-lstm-crf
pytorch
GitHub 中提及
HassanAzzam/Arabic-NER
tf
GitHub 中提及
epwalsh/pytorch-crf
pytorch
GitHub 中提及
hazelnutsgz/Naive-LSTM-CRF
pytorch
GitHub 中提及
moejoe95/crf-vs-rnn-ner
GitHub 中提及
Akshayanti/supersense-sequence-labelling
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| chunking-on-penn-treebank | BI-LSTM-CRF (Senna) (ours) | F1 score: 94.46 |
| named-entity-recognition-on-findvehicle | BiLSTM-CRF | F1 Score: 49.5 |