4 个月前

重新审视通过混合目标函数实现半监督文本分类的LSTM网络

重新审视通过混合目标函数实现半监督文本分类的LSTM网络

摘要

本文研究了双向LSTM网络在文本分类任务中的应用,采用了监督学习和半监督学习两种方法。先前的一些研究表明,要实现高分类准确性,要么需要使用无监督方法(如语言模型)进行复杂的预训练(Dai和Le 2015;Miyato、Dai和Goodfellow 2016),要么需要构建复杂的模型(Johnson和Zhang 2017)。然而,我们开发了一种训练策略,使得即使是一个简单的双向LSTM模型,在使用交叉熵损失函数进行训练时也能取得与更复杂方法相当的结果。此外,除了交叉熵损失之外,通过结合熵最小化、对抗性和虚拟对抗性损失对有标签和无标签数据进行训练,我们在多个基准数据集上报告了文本分类任务的最新结果。特别是在ACL-IMDB情感分析和AG-News主题分类数据集上,我们的方法显著优于当前的方法。我们还展示了混合目标函数的通用性,通过改进关系抽取任务的性能进一步验证了这一点。

基准测试

基准方法指标
sentiment-analysis-on-imdbL MIXED
Accuracy: 95.68
text-classification-on-ag-newsL MIXED
Error: 4.95
text-classification-on-dbpediaL MIXED
Error: 0.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
重新审视通过混合目标函数实现半监督文本分类的LSTM网络 | 论文 | HyperAI超神经