Aan de slagGa gratis aan de slag

Afbeeldingstensors

Een koffiebedrijf heeft een objectdetectieproject waarbij objecten van belang moeten worden geannoteerd, in dit geval espressoshots. Je hebt een lijst gemaakt met de bounding box-coördinaten voor een afbeelding van een espressoshot. Nu moet je de afbeelding en de coördinaten omzetten naar tensors.

torch en torchvision zijn geïmporteerd. torchvision.transforms is geïmporteerd als transforms. De afbeelding is geladen als image met Image.open() uit de PIL-bibliotheek. De bounding box-coördinaten zijn opgeslagen in de variabele bbox.

espresso

Deze oefening maakt deel uit van de cursus

Deep Learning voor afbeeldingen met PyTorch

Cursus bekijken

Oefeninstructies

  • Zet bbox om naar tensors met torch.tensor().
  • Herschik bbox_tensor door een batch-dimensie toe te voegen met unsqueeze(0).
  • Maak een transform om image te resizen naar (224) en om te zetten naar een niet-geschaalde afbeeldingstensor.
  • Pas transform toe op image.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)
Code bewerken en uitvoeren