
摘要
我们介绍了法国街道名称标志(French Street Name Signs, FSNS)数据集,该数据集包含从法国谷歌街景图像中裁剪出的超过一百万张街道名称标志图像。每张图像都包含了同一街道名称标志的多个视角。每个图像都有标准化、首字母大写的地面实况文本,这些文本在地图上也会以相同的形式出现。我们认为,FSNS 数据集足够庞大且复杂,可以训练一个具有相当复杂度的深度网络来“端到端”解决街道名称提取问题,或者探索单个复杂工程网络与多个设计用于解决子问题的子网络之间的设计权衡。我们展示了一个适用于 TensorFlow 的“端到端”网络/图及其在 FSNS 数据集上的结果。
代码仓库
xiaofengShi/CHINESE-OCR
tf
GitHub 中提及
witcher425/CHINESEOCR
tf
GitHub 中提及
OzHsu23/chineseocr
tf
GitHub 中提及
LinearPi/OCR_Chinese
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| optical-character-recognition-on-fsns-test | STREET | Sequence error: 27.54 |