
摘要
在句子分类任务中,额外的上下文信息(如相邻句子)可能会提高分类器的准确性。然而,这些上下文信息具有领域依赖性,因此不能用于领域不合适的其他分类任务。相比之下,我们提出使用翻译句子作为上下文,这种上下文在任何领域都可用。我们发现,简单的特征扩展翻译只能获得微小的改进,并且由于可能存在的不准确翻译而产生噪声句向量,这可能会降低分类器的性能。为此,我们提出了多上下文修复附件(Multiple Context Fixing Attachment, MCFA),这是一种将多个句向量连接起来以利用其他句向量作为上下文来修复噪声的模块系列。实验结果表明,我们的方法在与先前模型的竞争中表现出色,在多个数据集上取得了最佳分类性能。我们是第一个使用翻译作为领域无关上下文进行句子分类的研究团队。
代码仓库
rktamplayo/MCFA
官方
tf
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| subjectivity-analysis-on-subj | CNN+MCFA | Accuracy: 94.80 |
| text-classification-on-trec-6 | CNN+MCFA | Error: 4 |