Bildtensoren
Eine Kaffeemarke hat ein Projekt zur Objekterkennung, bei dem sie interessante Objekte markieren muss, in diesem Fall Espressi. Du hast eine Liste mit den Koordinaten der Begrenzungsrahmen für ein Espresso-Shot-Bild erstellt. Jetzt musst du das Bild und die Koordinaten in Tensoren umwandeln.
torch
und „ torchvision
“ wurden importiert. „ torchvision.transforms
“ wurde als „ transforms
“ importiert. Das Bild wurde als „ image
” mit „ Image.open()
” aus der Bibliothek „ PIL
” geladen. Die Koordinaten der Begrenzungsrahmen sind in der Variablen „ bbox
“ gespeichert.
Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Wandle die „
bbox
” mit „torch.tensor()
” in Tensoren um. - Gestalte „
bbox_tensor
“ um, indem du mit „unsqueeze(0)
“ eine Batch-Dimension hinzufügst. - Erstell eine Transformation, um die Größe von „
image
“ auf „(224)
“ zu ändern, und transformier das Ganze in einen nicht skalierten Bildtensor. - Schick deine Bewerbung mit dem Betreff „
transform
” animage
.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Convert bbox into tensors
bbox_tensor = ____
# Add a new batch dimension
bbox_tensor = bbox_tensor.____
# Resize image and transform tensor
transform = transforms.Compose([
transforms.____,
transforms.____
])
# Apply transform to image
image_tensor = ____
print(image_tensor)