Bildtensoren

Eine Kaffeemarke hat ein Projekt zur Objekterkennung, bei dem sie interessante Objekte markieren muss, in diesem Fall Espressi. Du hast eine Liste mit den Koordinaten der Begrenzungsrahmen für ein Espresso-Shot-Bild erstellt. Jetzt musst du das Bild und die Koordinaten in Tensoren umwandeln.

torch und „ torchvision “ wurden importiert. „ torchvision.transforms “ wurde als „ transforms “ importiert. Das Bild wurde als „ image ” mit „ Image.open() ” aus der Bibliothek „ PIL ” geladen. Die Koordinaten der Begrenzungsrahmen sind in der Variablen „ bbox “ gespeichert.

espresso

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

Wandle die „ bbox ” mit „ torch.tensor() ” in Tensoren um.
Gestalte „ bbox_tensor “ um, indem du mit „ unsqueeze(0) “ eine Batch-Dimension hinzufügst.
Erstell eine Transformation, um die Größe von „ image “ auf „ (224) “ zu ändern, und transformier das Ganze in einen nicht skalierten Bildtensor.
Schick deine Bewerbung mit dem Betreff „ transform ” an image.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)

Code bearbeiten und ausführen