
摘要
文本分类是自然语言处理中的一个基本任务。近年来,深度神经网络在文本分类任务中相比浅层模型取得了令人鼓舞的性能提升。尽管深度模型具有重要意义,但它们忽略了细粒度(词语与类别之间的匹配信号)分类线索,因为其分类主要依赖于文本级别的表示。为了解决这一问题,我们引入了交互机制,将词级匹配信号纳入文本分类任务中。具体而言,我们设计了一种新颖的框架——显式交互模型(EXplicit interAction Model,简称EXAM),该模型配备了交互机制。我们在多个基准数据集上验证了所提出的方法,这些数据集涵盖了多标签和多类别的文本分类任务。大量的实验结果表明了该方法的优势。作为副产品,我们发布了代码和参数设置,以促进其他研究工作。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| sentiment-analysis-on-amazon-review-full | EXAM | Accuracy: 61.9 |
| sentiment-analysis-on-amazon-review-polarity | EXAM | Accuracy: 95.5 |
| text-classification-on-ag-news | EXAM | Error: 7 |
| text-classification-on-dbpedia | EXAM | Error: 1 |
| text-classification-on-yahoo-answers | EXAM | Accuracy: 74.8 |