4 个月前

数据为中心的机器学习中的重新标记方法

数据为中心的机器学习中的重新标记方法

摘要

在工业界深度学习应用中,我们手动标注的数据中存在一定程度的噪声数据。为了解决这一问题并使开发数据集的得分超过90分,我们提出了一种简单的方法来识别噪声数据,并通过人工重新标注这些噪声数据,同时以模型预测结果作为参考。本文阐述了我们的方法适用于广泛的深度学习任务,包括分类、序列标记、目标检测、序列生成和点击率预测。开发数据集的评估结果和人工评估结果验证了我们的方法的有效性。

代码仓库

基准测试

基准方法指标
label-error-detection-on-trec-6github.com/guotong1988/Automatic-Label-Error-Correction
Accuracy: 99.0
text-classification-on-trec-6Automatic Label Error Correction
Error: 0.40

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
数据为中心的机器学习中的重新标记方法 | 论文 | HyperAI超神经