
摘要
本文介绍了阿里巴巴自然语言处理团队在IJCNLP 2017共享任务第1项——中文语法错误诊断(Chinese Grammatical Error Diagnosis, CGED)中的参赛系统。该任务旨在识别四类语法错误:冗余词(R)、缺失词(M)、用词不当(S)以及词序错误(W)。我们将该任务建模为序列标注问题,并设计了多种人工特征以提升性能。系统主要基于LSTM-CRF模型,并采用了三种集成策略来进一步优化结果。在错误识别与错误定位两个层面,我们的系统均取得了最高的F1分数。尤其在最具挑战性的定位层面,我们在所有评价指标上均表现最优。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 2d-human-pose-estimation-on-alibaba-cluster | mitsimpo | 10-20% Mask PSNR: 12 |