
摘要
我们研究了在神经序列标注方法中用于检测学习者写作错误的不同辅助目标和训练策略的效用。辅助成本为模型提供了额外的语料信息,使其能够学习通用的组合特征,这些特征随后可以被用于其他目标。实验结果表明,在领域内数据上使用并行标签进行联合训练的方法比先前最佳的错误检测系统表现更优。尽管最终模型的参数数量相同,但额外的目标使其能够更高效地优化并实现更好的性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| grammatical-error-detection-on-conll-2014-a1 | Bi-LSTM + POS (unrestricted data) | F0.5: 36.1 |
| grammatical-error-detection-on-conll-2014-a1 | Bi-LSTM + POS (trained on FCE) | F0.5: 17.5 |
| grammatical-error-detection-on-conll-2014-a2 | Bi-LSTM + POS (trained on FCE) | F0.5: 26.2 |
| grammatical-error-detection-on-conll-2014-a2 | Bi-LSTM + POS (unrestricted data) | F0.5: 45.1 |
| grammatical-error-detection-on-fce | Bi-LSTM + err POS GR | F0.5: 47.7 |