OCR Image Dataset

Try Pre-Trained Model

2023-07-13 4:25pm

2023-07-13 2:14pm

2023-07-12 4:24pm

v2

2023-07-13 2:14pm

Generated on Jul 13, 2023

Download Dataset

Popular Download Formats

TXT annotations and YAML config used with YOLOv9.

TXT annotations and YAML config used with YOLOv8.

TXT annotations and YAML config used with YOLOv5.

TXT annotations and YAML config used with YOLOv7.

COCO JSON annotations are used with EfficientDet Pytorch and Detectron 2.

Darknet TXT annotations used with YOLO Darknet (both v3 and v4) and YOLOv3 PyTorch.

Common XML annotation format for local data munging (pioneered by ImageNet).

TFRecord binary format used for both Tensorflow 1.5 and Tensorflow 2.0 Object Detection models.

PaliGemma JSONL format used for fine-tuning PaliGemma, Google's open multimodal vision model.

CreateML JSON format is used with Apple's CreateML and Turi Create tools.

Choose another format.

4075 Total Images

View All Images

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Dataset Split

Train Set 90%

3684Images

Valid Set 8%

327Images

Test Set 2%

64Images

Preprocessing

Auto-Orient: Applied

Isolate Objects: Applied

Resize: Fit (white edges) in 640x640

Augmentations

Outputs per training example: 3

Rotation: Between -15° and +15°

Brightness: Between -25% and +25%

Similar Projects

More like yun20230712-8ibr5/ocr-o21b8

Logos-text

101 images

Object Detection Model snap

Logos

103 images

Object Detection Model snap

K-H-A-D-I-J-B-O-U-G-N-8-0-5-2-1

286 images

Object Detection Model yolov8s yolov8 snap

cars

2000 images

Object Detection Model

votering_1966_v2

Votes

2336 images

Object Detection