doc_detection Dataset

2024-04-22 11:15pm

v1

2024-04-22 11:15pm

Generated on Apr 22, 2024

Download Dataset

Popular Download Formats

TXT annotations and YAML config used with YOLOv9.

TXT annotations and YAML config used with YOLOv8.

TXT annotations and YAML config used with YOLOv5.

TXT annotations and YAML config used with YOLOv7.

COCO JSON annotations are used with EfficientDet Pytorch and Detectron 2.

Darknet TXT annotations used with YOLO Darknet (both v3 and v4) and YOLOv3 PyTorch.

Common XML annotation format for local data munging (pioneered by ImageNet).

TFRecord binary format used for both Tensorflow 1.5 and Tensorflow 2.0 Object Detection models.

PaliGemma JSONL format used for fine-tuning PaliGemma, Google's open multimodal vision model.

CreateML JSON format is used with Apple's CreateML and Turi Create tools.

Choose another format.

310 Total Images

View All Images

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Dataset Split

Train Set 93%

288Images

Valid Set 5%

15Images

Test Set 2%

7Images

Preprocessing

Auto-Orient: Applied

Resize: Stretch to 640x640

Augmentations

Outputs per training example: 4

Flip: Horizontal, Vertical

Shear: ±3° Horizontal, ±3° Vertical

Grayscale: Apply to 5% of images

Hue: Between -5° and +5°

Saturation: Between -8% and +8%

Brightness: Between -8% and +8%

Exposure: Between -8% and +8%

Similar Projects

Object Detection

DOCUMENT DETECTION testign

4k images

Document Classification Shreyeska

3.9k images

Object Detection

doc_detection newspace

110 images

Object Detection Model snap

Testing testign

3.9k images 1 model

Object Detection Model snap

DOCUMENT DETECTION DOCUMENT DETECTION

3.7k images 2 models