
摘要
MNIST数据集已成为学习、分类和计算机视觉系统的一个标准基准。其广泛采用的原因在于任务的可理解性和直观性、相对较小的数据量和存储需求以及数据库本身的易用性和可访问性。MNIST数据库源自一个更大的数据集,即NIST特殊数据库19(NIST Special Database 19),该数据集包含手写数字、大写字母和小写字母。本文介绍了一种基于完整NIST数据集的变体,我们称之为扩展MNIST(Extended MNIST,简称EMNIST),该变体采用了与创建MNIST数据集相同的转换方法。结果生成了一系列更具挑战性的分类任务数据集,这些任务涉及字母和数字,并且保留了与原始MNIST任务相同的数据结构和参数,从而可以直接兼容所有现有的分类器和系统。文中还展示了基准测试结果,并通过比较转换后的NIST数字与MNIST数字的分类结果来验证转换过程的有效性。
代码仓库
compSciKai/CMPT414-Term-Project-Tensorflow-OCR
tf
GitHub 中提及
hosford42/EMNIST
GitHub 中提及
Chizuchizu/amplify-hackathon
pytorch
GitHub 中提及
ajlee19/GestureKeyboard
GitHub 中提及
shivang2k/CharacterClassifier
tf
GitHub 中提及
CottonBall811/English-Alphabet-OCR
GitHub 中提及
Sharron4me/EMNIST-Prediction-Model
GitHub 中提及
christianversloot/extra_keras_datasets
tf
GitHub 中提及
minhduchoang301/OCR-community-website
tf
GitHub 中提及
astridrou/fiveLetterClassification
tf
GitHub 中提及
NikhilVanapalli/Gesture-Recognition-for-HCI
tf
GitHub 中提及
rlh1994/cw_wame_optimiser_cnn
tf
GitHub 中提及
bnjobam/EMNIST-analysis
tf
GitHub 中提及
JPDaly/MultilayerPerceptron
GitHub 中提及
andrewbespaly/canvas_character_recognition
tf
GitHub 中提及
mohitiitb/DummyRepo
tf
GitHub 中提及
minhduchoang301/AmsText-OCR--website
tf
GitHub 中提及
Lornatang/TensorFlow-MNIST
tf
GitHub 中提及
zmr1128/EMNIST
tf
GitHub 中提及
adipro7/Handwritten-Captcha-Recognition
tf
GitHub 中提及
JustRodneyLee/ML101-OCR
GitHub 中提及
austin-hill/EMNIST-CNN
pytorch
GitHub 中提及
Whole-Brain/mnist-reader
GitHub 中提及
spikeeSakshu/CharacterRecognition
GitHub 中提及
chuiyunjun/projectCSC413
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-emnist-balanced | Linear Classifier | Accuracy: 50.93 |
| image-classification-on-emnist-balanced | OPIUM Classifier | Accuracy: 78.94 |
| image-classification-on-emnist-digits | OPIUM Classifier | Accuracy (%): 96.30 |
| image-classification-on-emnist-digits | Linear Classifier | Accuracy (%): 84.70 |
| image-classification-on-emnist-letters | Linear Classifier | Accuracy: 55.78 |
| image-classification-on-emnist-letters | OPIUM Classifier | Accuracy: 85.27 |