
摘要
基于图像的序列识别一直是计算机视觉领域的长期研究课题。本文探讨了场景文字识别问题,这是基于图像的序列识别中最重要且最具挑战性的任务之一。我们提出了一种新颖的神经网络架构,该架构将特征提取、序列建模和转录集成到一个统一的框架中。与现有的场景文字识别系统相比,所提出的架构具有四个显著特点:(1)端到端可训练,而大多数现有算法的各个组件是分别训练和调优的;(2)能够自然处理任意长度的序列,无需进行字符分割或水平尺度归一化;(3)不受任何预定义词典的限制,在无词典和有词典的场景文字识别任务中均表现出色;(4)生成了一个高效且体积更小的模型,这在实际应用中更为实用。我们在包括IIIT-5K、Street View Text和ICDAR数据集在内的标准基准上进行了实验,结果表明所提出的算法优于先前的技术。此外,所提出的算法在基于图像的乐谱识别任务中也表现良好,这显然验证了其通用性。
代码仓库
bai-shang/crnn_ctc_ocr.Tensorflow
tf
GitHub 中提及
Yuting-Gao/CRNN_Mxnet
tf
GitHub 中提及
courao/ocr.pytorch
pytorch
GitHub 中提及
Liumihan/CRNN_pytorch
pytorch
GitHub 中提及
9ruddls3/CRNN_Pytorch
pytorch
GitHub 中提及
cjxxx0/license
tf
GitHub 中提及
PratirupG/Handwriting-Recognition
tf
GitHub 中提及
chauthehan/CRNN_OCR_CMND
GitHub 中提及
Crespo-dong/caffe_ocr
GitHub 中提及
oyxhust/CNN-LSTM-CTC-text-recognition
tf
GitHub 中提及
zwenwang/CTPN_Pytorch
pytorch
GitHub 中提及
lostsword/character_recognition
mindspore
GitHub 中提及
bai-shang/crnn_ctc_ocr_tf
tf
GitHub 中提及
tranbahien/CTC-OCR
tf
GitHub 中提及
samueltin/tf-crnn_backup20180808
tf
GitHub 中提及
bai-shang/CRNN_CTC_Tensorflow
tf
GitHub 中提及
WenmuZhou/crnn.pytorch
pytorch
githubharald/simplehtr
tf
GitHub 中提及
zhiqwang/image-captioning
pytorch
GitHub 中提及
DnanaDev/CRNN_for_OCR
tf
GitHub 中提及
HassamChundrigar/Urdu-Ocr
tf
GitHub 中提及
Holmeyoung/crnn-pytorch
pytorch
nithyadurai87/pottan-ocr-tamil
pytorch
GitHub 中提及
qjadud1994/CRNN-Keras
tf
GitHub 中提及
zhiqwang/crnn.pytorch
pytorch
GitHub 中提及
junstar92/hangul-syllable-recognition
tf
GitHub 中提及
solivr/tf-crnn
tf
GitHub 中提及
CodeAchieveDream/crnn_model
pytorch
GitHub 中提及
wangrui1996/crnnLicensePlateRecognition
tf
GitHub 中提及
mindee/doctr
pytorch
GitHub 中提及
shivaverma/Score-Time-Detection
pytorch
GitHub 中提及
sbillburg/CRNN-with-STN
tf
GitHub 中提及
WenmuZhou/PytorchOCR
pytorch
GitHub 中提及
mineshmathew/pytorch_rnn_examples
pytorch
GitHub 中提及
jackknife007/crnn
tf
GitHub 中提及
ztoString/CRNN_CTC_OCR_TensorFlow
tf
GitHub 中提及
zyasjtu/CNN-RNN-CTC
tf
GitHub 中提及
meijieru/crnn.pytorch
pytorch
MaybeShewill-CV/CRNN_Tensorflow
tf
GitHub 中提及
GitYCC/crnn-pytorch
pytorch
GitHub 中提及
DCSong/CRNN-DenseNet
pytorch
GitHub 中提及
FLming/CRNN.tf2
tf
GitHub 中提及
xmy0916/pytorch_crnn
pytorch
GitHub 中提及
WenmuZhou/Segmentation-Free_OCR
tf
GitHub 中提及
JaidedAI/EasyOCR
pytorch
GitHub 中提及
sonamghosh/local_hack_day_2018
pytorch
GitHub 中提及
bgshih/crnn
pytorch
GitHub 中提及
mindspore-lab/mindocr
mindspore
shreshtashetty/OCR
tf
GitHub 中提及
anuragcp/iocl-deepocr
tf
GitHub 中提及
topdu/openocr
pytorch
GitHub 中提及
moto8xpk/DataExtractionJejuMLCamp
GitHub 中提及
cipri-tom/type-aware-crnn
tf
GitHub 中提及
lidongliang666/cv_deep_learning
pytorch
GitHub 中提及
xusongpei/crnn-ctc
tf
GitHub 中提及
Mingtzge/2019-CCF-BDCI-OCR-MCZJ-OCR-IdentificationIDElement
pytorch
GitHub 中提及
sgenza/tf_crnn
tf
GitHub 中提及
bharatsush/TextSpotting
tf
GitHub 中提及
PaddlePaddle/PaddleOCR
paddle
GitHub 中提及
foamliu/CRNN
pytorch
GitHub 中提及
senlinuc/caffe_ocr
GitHub 中提及
abhiraman/Capstone_Project
pytorch
GitHub 中提及
harish2704/pottan-ocr
pytorch
GitHub 中提及
juanluisrosaramos/CRNN_OCR
tf
GitHub 中提及
carnotaur/crnn-tutorial
pytorch
GitHub 中提及
bai-shang/OCR_TF_CRNN_CTC
tf
GitHub 中提及
Liumihan/CRNN_kreas
tf
GitHub 中提及
weinman/cnn_lstm_ctc_ocr
tf
GitHub 中提及
rickyHong/CRNN-Tensorflow-Text-repl
tf
GitHub 中提及
abdulwaheedsoudagar/ImageTextTranslation
tf
GitHub 中提及
bhavitvyamalik/OCR-using-CRNN
GitHub 中提及
SYR-Aegis/BrailleOCR
pytorch
GitHub 中提及
Media-Smart/vedastr
pytorch
GitHub 中提及
L706077/OCR-CRNN
pytorch
GitHub 中提及
wacr2008/tensorflow_crnn
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 | 
|---|---|---|
| scene-text-recognition-on-icdar-2003 | CRNN | Accuracy: 89.4 | 
| scene-text-recognition-on-icdar2013 | CRNN | Accuracy: 86.7 | 
| scene-text-recognition-on-svt | CRNN | Accuracy: 80.8 |