
摘要
本文介绍了一种用于神经序列标注的工具包NCRF++。NCRF++旨在快速实现不同类型的带有条件随机场(CRF)推理层的神经序列标注模型。该工具包通过配置文件为用户提供构建自定义模型结构的推理功能,支持灵活设计和利用神经特征。基于PyTorch开发,核心操作以批量方式进行计算,结合GPU加速,使得该工具包具有高效性。此外,NCRF++还包含了大多数最新的神经序列标注模型(如LSTM-CRF)的实现,便于在这些方法上进行复现和改进。
代码仓库
jiesutd/NCRFpp
官方
pytorch
GitHub 中提及
jiesutd/PyTorchSeqLabel
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| chunking-on-penn-treebank | NCRF++ | F1 score: 95.06 |
| named-entity-recognition-ner-on-conll-2003 | NCRF++ | F1: 91.35 |
| part-of-speech-tagging-on-penn-treebank | NCRF++ | Accuracy: 97.49 |