HyperAIHyperAI

Command Palette

Search for a command to run...

官方文本来源推断:SVM 能否超越 ULMFiT?

Marcelo Magalhães Silva de Sousa Teófilo Emidio de Campos Pedro Henrique Luz de Araujo

摘要

官方公报是公众获取相关信息的重要信息来源。对其内容进行细致审查,有助于发现可能引发公共资金管理不当的欺诈行为与异常情况。本文提出一个数据集,其中包含来自联邦区官方公报的文档,涵盖带有文档来源标注的样本以及未标注的样本。我们训练、评估并比较了一种基于迁移学习的模型(采用ULMFiT方法),与传统基于词袋模型(Bag-of-Words)的分类器(分别使用支持向量机SVM和朴素贝叶斯Naive Bayes)的性能表现。研究结果表明,SVM模型具有较强的竞争力,其性能略逊于ULMFiT模型,但训练与推理速度显著更快,且计算资源消耗更低。最后,我们通过消融实验(ablation analysis)评估了ULMFiT各组成部分对整体性能的影响。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
官方文本来源推断:SVM 能否超越 ULMFiT? | 论文 | HyperAI超神经