COCO Plugin¶

coco ¶

Classes¶

COCOLoader ¶

Bases: LoaderPlugin

COCO format dataset loader.

Functions¶

load ¶

load(path: str | PathLike[str], name: str | None = None, images_dir: str | PathLike[str] | None = None, **_kwargs: Any) -> Dataset

Load COCO dataset.

Parameters:

Name	Type	Description	Default
`path`	`str \| PathLike[str]`	Path to COCO annotation JSON file	required
`name`	`str \| None`	Optional dataset name. If not provided, the filename (without extension) will be used.	`None`
`images_dir`	`str \| PathLike[str] \| None`	Optional custom path to images directory	`None`
`**_kwargs`	`Any`	Additional parameters (ignored)	`{}`

Returns:

Type	Description
`Dataset`	Loaded Dataset

Source code in boxlab/dataset/plugins/coco.py

def load(
    self,
    path: str | os.PathLike[str],
    name: str | None = None,
    images_dir: str | os.PathLike[str] | None = None,
    **_kwargs: t.Any,
) -> Dataset:
    """Load COCO dataset.

    Args:
        path: Path to COCO annotation JSON file
        name: Optional dataset name. If not provided, the filename (without
            extension) will be used.
        images_dir: Optional custom path to images directory
        **_kwargs: Additional parameters (ignored)

    Returns:
        Loaded Dataset
    """
    annotation_path = pathlib.Path(path)

    if not annotation_path.exists():
        raise FileNotFoundError(f"Annotation file not found: {annotation_path}")

    # Auto-detect images directory
    if images_dir is not None:
        images_dir = pathlib.Path(images_dir)
    else:
        images_dir = self._find_images_dir(annotation_path)

    with annotation_path.open(mode="r") as f:
        coco_data = json.load(f)

    dataset_name = name or annotation_path.stem
    dataset = Dataset(name=dataset_name)

    logger.info(f"Loading COCO dataset from {annotation_path}")

    # Load categories
    for cat in coco_data.get("categories", []):
        dataset.add_category(cat["id"], cat["name"])

    logger.info(f"Loaded {len(dataset.categories)} categories")

    # Load images
    images_found = 0
    images_missing = 0

    for img in coco_data.get("images", []):
        img_path = self._find_image_path(img["file_name"], images_dir)

        if img_path:
            images_found += 1
        else:
            images_missing += 1

        img_info = ImageInfo(
            image_id=str(img["id"]),
            file_name=img["file_name"],
            width=img["width"],
            height=img["height"],
            path=img_path,
        )
        dataset.add_image(img_info, source_name=dataset_name)

    logger.info(
        f"Loaded {len(dataset.images)} images (found: {images_found}, missing: {images_missing})"
    )

    # Load annotations
    for ann in coco_data.get("annotations", []):
        bbox_xywh = ann["bbox"]
        bbox = BBox.from_xywh(*bbox_xywh)

        cat_name = dataset.get_category_name(ann["category_id"])
        if cat_name is None:
            continue

        annotation = Annotation(
            bbox=bbox,
            category_id=ann["category_id"],
            category_name=cat_name,
            image_id=str(ann["image_id"]),
            annotation_id=str(ann["id"]),
            area=ann.get("area", bbox.area),
            iscrowd=ann.get("iscrowd", 0),
        )
        dataset.add_annotation(annotation)

    logger.info(f"Loaded {dataset.num_annotations()} annotations")

    return dataset

COCOExporter ¶

Bases: ExporterPlugin

COCO format dataset exporter.

Functions¶

export ¶

export(dataset: Dataset, output_dir: str | PathLike[str], split_ratio: SplitRatio | None = None, seed: int | None = None, naming_strategy: NamingStrategy | None = None, copy_images: bool = True, unified_structure: bool = False, **_kwargs: Any) -> None

Export to COCO format.

Parameters:

Name	Type	Description	Default
`dataset`	`Dataset`	Dataset to export	required
`output_dir`	`str \| PathLike[str]`	Output directory	required
`split_ratio`	`SplitRatio \| None`	Optional split ratios	`None`
`seed`	`int \| None`	Random seed	`None`
`naming_strategy`	`NamingStrategy \| None`	Naming strategy	`None`
`copy_images`	`bool`	Whether to copy images	`True`
`unified_structure`	`bool`	Use unified directory structure	`False`
`**_kwargs`	`Any`	Additional parameters (ignored)	`{}`

Source code in boxlab/dataset/plugins/coco.py

def export(
    self,
    dataset: Dataset,
    output_dir: str | os.PathLike[str],
    split_ratio: SplitRatio | None = None,
    seed: int | None = None,
    naming_strategy: NamingStrategy | None = None,
    copy_images: bool = True,
    unified_structure: bool = False,
    **_kwargs: t.Any,
) -> None:
    """Export to COCO format.

    Args:
        dataset: Dataset to export
        output_dir: Output directory
        split_ratio: Optional split ratios
        seed: Random seed
        naming_strategy: Naming strategy
        copy_images: Whether to copy images
        unified_structure: Use unified directory structure
        **_kwargs: Additional parameters (ignored)
    """
    output_dir = pathlib.Path(output_dir)
    output_dir.mkdir(parents=True, exist_ok=True)

    naming_strategy = naming_strategy or OriginalNaming()

    logger.info(f"Exporting COCO dataset to {output_dir}")

    image_counter = 0
    ann_counter = 0
    if split_ratio is None:
        all_image_ids = list(dataset.images.keys())
        self._export_split(
            dataset,
            output_dir,
            "train",
            all_image_ids,
            naming_strategy,
            copy_images,
            unified_structure,
        )
    else:
        splits = dataset.split(split_ratio, seed)
        for split_name, image_ids in splits.items():
            if image_ids:
                image_counter, ann_counter = self._export_split(
                    dataset,
                    output_dir,
                    split_name,
                    image_ids,
                    naming_strategy,
                    copy_images,
                    unified_structure,
                    image_counter,
                    ann_counter,
                )

    logger.info(f"COCO dataset exported to: {output_dir}")

Functions¶

options: show_root_heading: true show_source: true heading_level: 2 members_order: source show_signature_annotations: true separate_signature: true

Overview¶

The COCO plugin provides support for loading and exporting datasets in COCO (Common Objects in Context) JSON format. It handles the standard COCO annotation structure with support for images, categories, and bounding box annotations.

Format Specification¶

JSON Structure¶

{
  "images": [
    {
      "id": 1,
      "file_name": "image1.jpg",
      "width": 640,
      "height": 480
    }
  ],
  "annotations": [
    {
      "id": 1,
      "image_id": 1,
      "category_id": 1,
      "bbox": [x, y, width, height],
      "area": 12345.0,
      "iscrowd": 0
    }
  ],
  "categories": [
    {
      "id": 1,
      "name": "person"
    }
  ]
}

Bounding Box Format¶

COCO uses [x, y, width, height] format where:

x: Left coordinate (x_min)
y: Top coordinate (y_min)
width: Box width
height: Box height

COCOLoader¶

Load datasets from COCO format.

Basic Usage¶

from boxlab.dataset.plugins.registry import get_loader

loader = get_loader("coco")
dataset = loader.load("annotations/instances.json")

Specify Image Root¶

# Images located in different directory
dataset = loader.load(
    "annotations/instances.json",
    image_root="/path/to/images"
)

Custom Dataset Name¶

# Set custom dataset name
dataset = loader.load(
    "annotations/instances.json",
    name="my_coco_dataset"
)

Features¶

Parses standard COCO JSON format
Converts COCO bbox format to internal representation
Handles missing or invalid annotations gracefully
Supports both relative and absolute image paths
Validates image file existence
Logs warnings for missing images or invalid data

COCOExporter¶

Export datasets to COCO format.

Basic Usage¶

from boxlab.dataset.plugins.registry import get_exporter

exporter = get_exporter("coco")
exporter.export(dataset, output_dir="output/coco_format")

Export with Splits¶

from boxlab.dataset.types import SplitRatio

# Define split ratios
split_ratio = SplitRatio(train=0.7, val=0.2, test=0.1)

exporter.export(
    dataset,
    output_dir="output/coco_format",
    split_ratio=split_ratio,
    seed=42  # For reproducibility
)

Output structure:

output/coco_format/
├── train.json
├── val.json
├── test.json
└── images/
    ├── train/
    ├── val/
    └── test/

Export Options¶

from boxlab.dataset.plugins.naming import SequentialNaming

# Custom naming strategy
strategy = SequentialNaming(prefix="img", start=1, digits=6)

# Export with options
exporter.export(
    dataset,
    output_dir="output/coco_format",
    split_ratio=split_ratio,
    seed=42,
    naming_strategy=strategy,
    copy_images=True,  # Copy image files
    indent=2  # JSON formatting
)

Export Without Image Copying¶

# Only export annotations
exporter.export(
    dataset,
    output_dir="output/coco_format",
    copy_images=False
)

Features¶

Generates compliant COCO JSON format
Converts internal bbox format to COCO format
Handles filename conflicts automatically
Supports custom naming strategies
Optional image copying
Configurable JSON indentation
Preserves annotation metadata (area, iscrowd)

Coordinate Conversion¶

Loading (COCO → Internal)¶

# COCO bbox: [100, 50, 200, 150]
x, y, w, h = 100, 50, 200, 150

# Convert to internal format
x_min = x  # 100
y_min = y  # 50
x_max = x + w  # 300
y_max = y + h  # 200

Exporting (Internal → COCO)¶

# Internal bbox: x_min=100, y_min=50, x_max=300, y_max=200

x = x_min  # 100
y = y_min  # 50
w = x_max - x_min  # 200
h = y_max - y_min  # 150

# COCO bbox: [100, 50, 200, 150]

Image Path Resolution¶

During Loading¶

# Annotation specifies: "file_name": "image1.jpg"
# image_root: "/data/images"

# Resolved path: /data/images/image1.jpg
image_path = Path(image_root) / file_name

During Export¶

# Original path: /data/source/subfolder/image1.jpg
# Naming strategy: OriginalNaming()

# Exported filename: image1.jpg
# Exported path: output_dir/images/train/image1.jpg

Metadata Handling¶

Annotation Metadata¶

{
  "id": 1,
  "image_id": 1,
  "category_id": 1,
  "bbox": [100, 50, 200, 150],
  "area": 30000.0,     # Computed if not provided
  "iscrowd": 0         # Default: 0 (not crowd)
}

Image Metadata¶

{
  "id": 1,
  "file_name": "image1.jpg",
  "width": 640,
  "height": 480,
  "date_captured": "",  # Optional
  "license": 0,        # Optional
  "coco_url": "",      # Optional
  "flickr_url": ""     # Optional
}

Category Metadata¶

{
  "id": 1,
  "name": "person",
  "supercategory": ""  # Optional
}

Error Handling¶

The COCO plugin handles various error conditions:

Missing JSON file: Raises FileNotFoundError
Invalid JSON: Raises ValueError
Missing images: Logs warning and continues
Missing categories: Logs warning and skips annotation
Invalid bbox format: Logs warning and skips annotation
Duplicate IDs: Handled automatically with ID remapping

Advanced Usage¶

Custom JSON Configuration¶

# Export with custom JSON formatting
exporter.export(
    dataset,
    output_dir="output/coco_format",
    indent=4,  # Pretty print with 4 spaces
    ensure_ascii=False  # Allow Unicode characters
)

Batch Export¶

# Export multiple datasets to COCO format
datasets = [dataset1, dataset2, dataset3]

for i, ds in enumerate(datasets):
    exporter.export(
        ds,
        output_dir=f"output/coco_batch_{i}",
        copy_images=True
    )

COCO Plugin¶

coco ¶

Classes¶

COCOLoader ¶

Functions¶

load ¶

COCOExporter ¶

Functions¶

export ¶

Functions¶

Overview¶

Format Specification¶

JSON Structure¶

Bounding Box Format¶

COCOLoader¶

Basic Usage¶

Specify Image Root¶

Custom Dataset Name¶

Features¶

COCOExporter¶

Basic Usage¶

Export with Splits¶

Export Options¶

Export Without Image Copying¶

Features¶

Coordinate Conversion¶

Loading (COCO → Internal)¶

Exporting (Internal → COCO)¶

Image Path Resolution¶

During Loading¶

During Export¶

Metadata Handling¶

Annotation Metadata¶

Image Metadata¶

Category Metadata¶

Error Handling¶

Advanced Usage¶

Custom JSON Configuration¶

Batch Export¶

See Also¶