Afbeeldingstensors

Een koffiebedrijf heeft een objectdetectieproject waarbij objecten van belang moeten worden geannoteerd, in dit geval espressoshots. Je hebt een lijst gemaakt met de bounding box-coördinaten voor een afbeelding van een espressoshot. Nu moet je de afbeelding en de coördinaten omzetten naar tensors.

torch en torchvision zijn geïmporteerd. torchvision.transforms is geïmporteerd als transforms. De afbeelding is geladen als image met Image.open() uit de PIL-bibliotheek. De bounding box-coördinaten zijn opgeslagen in de variabele bbox.

espresso

Deze oefening maakt deel uit van de cursus

Deep Learning voor afbeeldingen met PyTorch

Bekijk cursus

Oefeninstructies

Zet bbox om naar tensors met torch.tensor().
Herschik bbox_tensor door een batch-dimensie toe te voegen met unsqueeze(0).
Maak een transform om image te resizen naar (224) en om te zetten naar een niet-geschaalde afbeeldingstensor.
Pas transform toe op image.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)

Code bewerken en uitvoeren