3 个月前

基于过程数据的偏差校正

基于过程数据的偏差校正

摘要

如今,三维(3D)软件已能够生成高度逼真的图像,其视觉效果几乎与真实图像难以区分。这一进展引发了一个关键问题:能否利用3D渲染数据来增强真实图像数据集?本文对此进行了探讨。我们证明了3D渲染数据——特别是基于程序化生成(procedural)的数据——在调整图像数据集中偏差方面的有效性。通过对动物图像进行误差分析,我们发现某些动物品种的误分类问题在很大程度上源于数据本身不足。为此,我们生成了这些分类表现较差品种的程序化图像,并在此基础上对模型进行进一步训练,结果表明,该模型在真实数据上的分类性能显著提升,尤其针对原本表现不佳的品种。我们认为,这一方法可广泛应用于提升各类代表性不足群体的视觉数据,例如罕见疾病图像、或存在潜在数据偏差的场景,从而有效提高模型的准确性与公平性。实验结果表明,经程序化数据增强后学习到的视觉表征,其性能可与直接从真实数据中学习的表征相媲美,甚至在某些情况下更优。然而,要实现优异性能,必须在3D程序化数据的生成过程中保持高度严谨性。我们视3D图像数据集为真实数据集的一种压缩且结构化的复制品。展望未来,随着程序化数据的不断增长,真实数据集可能变得日益庞大、难以管理、缺失严重或因隐私限制而无法获取。本文提出了一系列应对这一未来场景中视觉表征学习挑战的技术路径,为构建更具鲁棒性与可扩展性的视觉学习系统提供了新思路。

代码仓库

aiskunks/ai_research
官方
GitHub 中提及

基准测试

基准方法指标
representation-learning-on-animals-10top_model_weights_with_3d_2
1:1 Accuracy: 0.745896

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于过程数据的偏差校正 | 论文 | HyperAI超神经