
摘要
随着强大文本到图像扩散模型的出现,近期研究探索了利用合成数据以提升图像分类性能的可行性。这些研究证实,合成数据能够有效扩充甚至替代真实数据。在本工作中,我们探讨了合成数据在少样本、类别无关计数任务中的潜在优势。该任务要求生成与给定物体数量相对应的图像。然而,现有的文本到图像模型难以准确理解“数量”这一概念。为此,我们提出采用双重条件控制的Stable Diffusion模型,即同时结合文本提示(prompt)与密度图(density map),以增强少样本计数任务的训练数据集。由于训练数据集规模较小,微调后的模型倾向于生成与训练图像高度相似的样本。为提升合成图像的多样性,我们进一步提出在不同图像之间交换文本描述,从而生成未曾见过的物体类型组合与空间布局配置。实验结果表明,所提出的多样化生成策略显著提升了两种近期表现优异的少样本计数模型在FSC147与CARPK数据集上的计数准确率。
代码仓库
perladoubinsky/SemAug
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-counting-on-fsc147 | SemAug-SAFECount | MAE(test): 12.74 MAE(val): 12.59 RMSE(test): 89.90 RMSE(val): 44.95 |
| object-counting-on-fsc147 | SemAug-CounTR | MAE(test): 11.32 MAE(val): 12.31 RMSE(test): 77.50 RMSE(val): 41.65 |