CommencerCommencer gratuitement

Tenseurs d’images

Une entreprise de café mène un projet de détection d’objets où elle doit annoter des objets d’intérêt, ici des expressos. Vous avez créé une liste contenant les coordonnées de la boîte englobante pour une image d’expresso. Vous devez maintenant convertir l’image et les coordonnées en tenseurs.

torch et torchvision ont été importés. torchvision.transforms est importé sous le nom transforms. L’image a été chargée dans image avec Image.open() de la bibliothèque PIL. Les coordonnées de la boîte englobante sont stockées dans la variable bbox.

espresso

Cet exercice fait partie du cours

Deep Learning pour l’image avec PyTorch

Afficher le cours

Instructions

  • Convertissez bbox en tenseur avec torch.tensor().
  • Redimensionnez bbox_tensor en ajoutant une dimension de lot avec unsqueeze(0).
  • Créez une transformation pour redimensionner image à (224) et la convertir en un tenseur d’image non mis à l’échelle.
  • Appliquez transform à image.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)
Modifier et exécuter le code