Afbeeldingstensors
Een koffiebedrijf heeft een objectdetectieproject waarbij objecten van belang moeten worden geannoteerd, in dit geval espressoshots. Je hebt een lijst gemaakt met de bounding box-coördinaten voor een afbeelding van een espressoshot. Nu moet je de afbeelding en de coördinaten omzetten naar tensors.
torch en torchvision zijn geïmporteerd. torchvision.transforms is geïmporteerd als transforms. De afbeelding is geladen als image met Image.open() uit de PIL-bibliotheek. De bounding box-coördinaten zijn opgeslagen in de variabele bbox.

Deze oefening maakt deel uit van de cursus
Deep Learning voor afbeeldingen met PyTorch
Oefeninstructies
- Zet
bboxom naar tensors mettorch.tensor(). - Herschik
bbox_tensordoor een batch-dimensie toe te voegen metunsqueeze(0). - Maak een transform om
imagete resizen naar(224)en om te zetten naar een niet-geschaalde afbeeldingstensor. - Pas
transformtoe opimage.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Convert bbox into tensors
bbox_tensor = ____
# Add a new batch dimension
bbox_tensor = bbox_tensor.____
# Resize image and transform tensor
transform = transforms.Compose([
transforms.____,
transforms.____
])
# Apply transform to image
image_tensor = ____
print(image_tensor)