3 个月前

HSCNN:一种用于极端不平衡多标签文本分类的混合孪生卷积神经网络

HSCNN:一种用于极端不平衡多标签文本分类的混合孪生卷积神经网络

摘要

数据不平衡问题是多标签文本分类中一个关键挑战。尽管已有部分研究通过提出非平衡损失函数来替代传统的交叉熵损失以应对该问题,但在极端不平衡数据场景下,其性能仍存在局限。为此,我们提出一种混合解决方案:针对头部类别(高频类别)采用通用网络架构,针对尾部类别(低频类别)则引入少样本学习技术。我们进一步提出一种混合式孪生卷积神经网络(Hybrid-Siamese Convolutional Neural Network, HSCNN),并赋予其若干关键技术特性,包括基于单网络与孪生网络的多任务架构、孪生结构中针对类别特异性的相似性建模机制,以及专为训练HSCNN设计的特定采样策略。在两个基准数据集和三种损失函数下的实验结果表明,所提方法能够显著提升单一网络在尾部类别及全类别上的分类性能,且适用于多种损失函数配置。

基准测试

基准方法指标
spectral-reconstruction-on-arad-1kHSCNN+
MRAE: 0.3814
PSNR: 26.36
RMSE: 0.0588

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
HSCNN:一种用于极端不平衡多标签文本分类的混合孪生卷积神经网络 | 论文 | HyperAI超神经