
摘要
在线问答(Q&A)与开源社区通常利用标签(tags)和关键词对内容进行索引、分类与检索。标签推荐最显著的优势在于能够实现信息的准确分类。在本研究中,我们首次将BERT预训练技术应用于在线问答与开源社区的标签推荐任务中。在FreeCode数据集上的实验结果表明,所提出的TagBERT方法在准确率方面优于现有的深度学习模型及其他基线方法。此外,我们的模型通过有效解决以往研究中存在的问题——即随着推荐标签数量的增加,模型性能显著下降——实现了更高的稳定性。
代码仓库
Moradnejad/Bert-Based-Tag-Recommendation
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| multi-label-text-classification-on-freecode | TagCNN | F1-score: 45.3 |
| multi-label-text-classification-on-freecode | TagBERT | F1-score: 46 |
| multi-label-text-classification-on-freecode | TagMulRec | F1-score: 36.4 |
| multi-label-text-classification-on-freecode | FastTagRec | F1-score: 33.2 |
| multi-label-text-classification-on-freecode | EnTagRec | F1-score: 36 |