Tenseurs d'image
Une entreprise de café a un projet de détection d'objets dans le cadre duquel elle doit annoter des objets d'intérêt, en l'occurrence des expressos. Vous avez créé une liste contenant les coordonnées du cadre de sélection d'une image représentant un espresso. Maintenant, vous devez convertir l'image et les coordonnées en tenseurs.
torch
et torchvision
ont été importés. torchvision.transforms
est importé sous le nom transforms
. L'image a été chargée sous le nom « image
» à l'aide de la bibliothèque « Image.open()
» disponible sur PIL
. Les coordonnées du cadre englobant sont stockées dans la variable bbox
.
Cet exercice fait partie du cours
Deep learning pour les images avec PyTorch
Instructions
- Convertissez l'
bbox
en tenseurs à l'aide de l'torch.tensor()
. - Remodelez l'
bbox_tensor
en ajoutant une dimension de lot à l'aide deunsqueeze(0)
. - Créez une transformation pour redimensionner
image
en(224)
et transformez-la en un tenseur d'image non mis à l'échelle. transform
image
Veuillez postuler sur .
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert bbox into tensors
bbox_tensor = ____
# Add a new batch dimension
bbox_tensor = bbox_tensor.____
# Resize image and transform tensor
transform = transforms.Compose([
transforms.____,
transforms.____
])
# Apply transform to image
image_tensor = ____
print(image_tensor)