
摘要
我们提出了一种解决问句同义改写识别问题的方案。本研究重点关注一个最近发布的标注了二元同义改写标签的问句对数据集,并展示了分解注意力模型(Parikh等人,2016)的一个变体在该任务上取得了准确的性能,同时其复杂度远低于许多竞争性的神经网络架构。此外,当该模型在自动收集的含噪声问句同义改写数据集上进行预训练时,它在该数据集上获得了最佳报告性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| paraphrase-identification-on-quora-question | pt-DecAtt | Accuracy: 88.40 |