Text-Extractor Image Dataset

2022-09-18 9:43pm

2022-09-18 7:18pm

2022-09-18 2:13pm

v3

2022-09-18 9:43pm

Generated on Sep 18, 2022

Download Dataset

Popular Download Formats

TXT annotations and YAML config used with YOLOv9.

TXT annotations and YAML config used with YOLOv8.

TXT annotations and YAML config used with YOLOv5.

TXT annotations and YAML config used with YOLOv7.

COCO JSON annotations are used with EfficientDet Pytorch and Detectron 2.

Darknet TXT annotations used with YOLO Darknet (both v3 and v4) and YOLOv3 PyTorch.

Common XML annotation format for local data munging (pioneered by ImageNet).

TFRecord binary format used for both Tensorflow 1.5 and Tensorflow 2.0 Object Detection models.

PaliGemma JSONL format used for fine-tuning PaliGemma, Google's open multimodal vision model.

CreateML JSON format is used with Apple's CreateML and Turi Create tools.

Choose another format.

143 Total Images

View All Images

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Annotation Visualization

Dataset Split

Train Set 78%

111Images

Valid Set 15%

22Images

Test Set 7%

10Images

Preprocessing

Filter Null: Require all images to contain annotations.

Augmentations

No augmentations were applied.

Similar Projects

More like seusl/text-extractor

PDF Figure Detection - Ceci

figures

260 images

Object Detection

PDF Figure Detection

figures

264 images

Object Detection

All raw datasets

figures

1032 images

Object Detection

figure-detect-01

figreDetectYolo

figure-in-article

264 images

Object Detection Model snap

PDF Figure Detection - Charlie & Yanni

figures

509 images

Object Detection