
摘要
版面分析在古籍手写文档分析中是一项至关重要的任务,是实现后续任务(如光学字符识别和自动转录)简化的基础步骤。然而,目前大多数解决该问题的方法均依赖于完全监督学习范式。尽管这类系统在该任务上取得了优异的性能,但其缺点在于,对整个训练集进行像素级文本标注的过程极为耗时,导致此类精细标注数据在实际应用场景中极为稀缺。本文针对这一问题,提出了一种高效的少样本学习框架,在公开可用的DIVA-HisDB数据集上,其性能可与当前最先进的完全监督方法相媲美。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semantic-segmentation-on-diva-hisdb | WACV '23 (few-shot) | Mean IoU (class): 96.30 |