Bild-Tensoren
Ein Kaffeeunternehmen hat ein Object-Detection-Projekt, bei dem Objekte von Interesse annotiert werden müssen – in diesem Fall Espresso-Shots. Du hast eine Liste mit den Bounding-Box-Koordinaten für ein Espresso-Bild erstellt. Jetzt musst du das Bild und die Koordinaten in Tensoren umwandeln.
torch und torchvision wurden importiert. torchvision.transforms ist als transforms importiert. Das Bild wurde als image mithilfe von Image.open() aus der PIL-Bibliothek geladen. Die Bounding-Box-Koordinaten sind in der Variable bbox gespeichert.

Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Wandle
bboxmithilfe vontorch.tensor()in Tensoren um. - Forme
bbox_tensorum, indem du mitunsqueeze(0)eine Batch-Dimension hinzufügst. - Erstelle eine Transform, um
imageauf(224)zu skalieren und in einen unskalierten Bild-Tensor umzuwandeln. - Wende
transformaufimagean.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Convert bbox into tensors
bbox_tensor = ____
# Add a new batch dimension
bbox_tensor = bbox_tensor.____
# Resize image and transform tensor
transform = transforms.Compose([
transforms.____,
transforms.____
])
# Apply transform to image
image_tensor = ____
print(image_tensor)