Tenseurs d’images
Une entreprise de café mène un projet de détection d’objets où elle doit annoter des objets d’intérêt, ici des expressos. Vous avez créé une liste contenant les coordonnées de la boîte englobante pour une image d’expresso. Vous devez maintenant convertir l’image et les coordonnées en tenseurs.
torch et torchvision ont été importés. torchvision.transforms est importé sous le nom transforms. L’image a été chargée dans image avec Image.open() de la bibliothèque PIL. Les coordonnées de la boîte englobante sont stockées dans la variable bbox.

Cet exercice fait partie du cours
Deep Learning pour l’image avec PyTorch
Instructions
- Convertissez
bboxen tenseur avectorch.tensor(). - Redimensionnez
bbox_tensoren ajoutant une dimension de lot avecunsqueeze(0). - Créez une transformation pour redimensionner
imageà(224)et la convertir en un tenseur d’image non mis à l’échelle. - Appliquez
transformàimage.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert bbox into tensors
bbox_tensor = ____
# Add a new batch dimension
bbox_tensor = bbox_tensor.____
# Resize image and transform tensor
transform = transforms.Compose([
transforms.____,
transforms.____
])
# Apply transform to image
image_tensor = ____
print(image_tensor)