4 个月前

TextCaps:小规模数据集上的手写字符识别

TextCaps:小规模数据集上的手写字符识别

摘要

许多地方性语言由于缺乏大量标注训练数据而难以从近期字符识别系统的进展中获益。这主要是因为生成这些语言的大规模标注数据较为困难,同时深度学习技术在少量训练样本上无法有效学习。为了解决这一问题,我们引入了一种从现有样本生成新训练样本的技术,通过向其对应的实例参数添加随机控制噪声来实现现实增强,从而反映人类手写中的实际变化。我们的实验结果显示,在每个类别仅有200个训练样本的情况下,该方法在EMNIST字母数据集上的字符识别性能超过了现有结果,并且在三个数据集(EMNIST平衡数据集、EMNIST数字数据集和MNIST数据集)上达到了现有水平。此外,我们还开发了一种策略,通过有效结合损失函数来改进重建效果。我们的系统对于那些缺乏大量标注训练数据的地方性语言字符识别非常有用,甚至在其他相关的一般性场景如物体识别中也有应用价值。

代码仓库

基准测试

基准方法指标
image-classification-on-emnist-lettersTextCaps
Accuracy: 95.39
image-classification-on-fashion-mnistTextCaps
Percentage error: 6.29
image-classification-on-mnistTextCaps
Accuracy: 99.71
Percentage error: 0.29

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TextCaps:小规模数据集上的手写字符识别 | 论文 | HyperAI超神经