LoslegenKostenlos loslegen

Bild-Tensoren

Ein Kaffeeunternehmen hat ein Object-Detection-Projekt, bei dem Objekte von Interesse annotiert werden müssen – in diesem Fall Espresso-Shots. Du hast eine Liste mit den Bounding-Box-Koordinaten für ein Espresso-Bild erstellt. Jetzt musst du das Bild und die Koordinaten in Tensoren umwandeln.

torch und torchvision wurden importiert. torchvision.transforms ist als transforms importiert. Das Bild wurde als image mithilfe von Image.open() aus der PIL-Bibliothek geladen. Die Bounding-Box-Koordinaten sind in der Variable bbox gespeichert.

espresso

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

  • Wandle bbox mithilfe von torch.tensor() in Tensoren um.
  • Forme bbox_tensor um, indem du mit unsqueeze(0) eine Batch-Dimension hinzufügst.
  • Erstelle eine Transform, um image auf (224) zu skalieren und in einen unskalierten Bild-Tensor umzuwandeln.
  • Wende transform auf image an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)
Code bearbeiten und ausführen