OCR_V3 Image Dataset

2023-04-30 8:50pm

2023-04-30 8:31pm

2023-04-28 8:23pm

2023-04-27 4:30pm

2023-04-19 3:42pm

v2

2023-04-27 4:30pm

Generated on Apr 27, 2023

Download Dataset

Popular Download Formats

TXT annotations and YAML config used with YOLOv9.

TXT annotations and YAML config used with YOLOv8.

TXT annotations and YAML config used with YOLOv5.

TXT annotations and YAML config used with YOLOv7.

COCO JSON annotations are used with EfficientDet Pytorch and Detectron 2.

Darknet TXT annotations used with YOLO Darknet (both v3 and v4) and YOLOv3 PyTorch.

Common XML annotation format for local data munging (pioneered by ImageNet).

TFRecord binary format used for both Tensorflow 1.5 and Tensorflow 2.0 Object Detection models.

PaliGemma JSONL format used for fine-tuning PaliGemma, Google's open multimodal vision model.

CreateML JSON format is used with Apple's CreateML and Turi Create tools.

Choose another format.

11509 Total Images

View All Images

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Dataset Split

Train Set 98%

11322Images

Valid Set 2%

187Images

Test Set %

0Images

Preprocessing

Modify Classes: 0 remapped, 2 dropped

Augmentations

Outputs per training example: 3

Rotation: Between -5° and +5°

Grayscale: Apply to 25% of images

Hue: Between -20° and +20°

Saturation: Between -20% and +20%

Brightness: Between -20% and +20%

Blur: Up to 1.75px

Noise: Up to 5% of pixels

Cutout: 7 boxes with 8% size each

Similar Projects

More like ocr-gjplg/ocr_v3

digits

5820 images

Object Detection

reading

7286 images

Object Detection

reading

7422 images

Object Detection

reading

1708 images

Object Detection

reading

1708 images

Object Detection