LoslegenKostenlos starten

Bild-Tensoren

Ein Kaffeeunternehmen hat ein Object-Detection-Projekt, bei dem Objekte von Interesse annotiert werden müssen – in diesem Fall Espresso-Shots. Du hast eine Liste mit den Bounding-Box-Koordinaten für ein Espresso-Bild erstellt. Jetzt musst du das Bild und die Koordinaten in Tensoren umwandeln.

torch und torchvision wurden importiert. torchvision.transforms ist als transforms importiert. Das Bild wurde als image mithilfe von Image.open() aus der PIL-Bibliothek geladen. Die Bounding-Box-Koordinaten sind in der Variable bbox gespeichert.

espresso

Diese Übung ist Teil des Kurses

<Kurs>Deep Learning für Bilder mit PyTorch</Kurs>
Kurs ansehen

Übungsanweisungen

  • Wandle bbox mithilfe von torch.tensor() in Tensoren um.
  • Forme bbox_tensor um, indem du mit unsqueeze(0) eine Batch-Dimension hinzufügst.
  • Erstelle eine Transform, um image auf (224) zu skalieren und in einen unskalierten Bild-Tensor umzuwandeln.
  • Wende transform auf image an.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)
Code bearbeiten und ausführen