Tenseurs d'image

Une entreprise de café a un projet de détection d'objets dans le cadre duquel elle doit annoter des objets d'intérêt, en l'occurrence des expressos. Vous avez créé une liste contenant les coordonnées du cadre de sélection d'une image représentant un espresso. Maintenant, vous devez convertir l'image et les coordonnées en tenseurs.

torch et torchvision ont été importés. torchvision.transforms est importé sous le nom transforms. L'image a été chargée sous le nom « image » à l'aide de la bibliothèque « Image.open() » disponible sur PIL. Les coordonnées du cadre englobant sont stockées dans la variable bbox.

expresso

Cet exercice fait partie du cours

Deep learning pour les images avec PyTorch

Afficher le cours

Instructions

Convertissez l'bbox en tenseurs à l'aide de l'torch.tensor().
Remodelez l'bbox_tensor en ajoutant une dimension de lot à l'aide de unsqueeze(0).
Créez une transformation pour redimensionner image en (224) et transformez-la en un tenseur d'image non mis à l'échelle.
transform imageVeuillez postuler sur .

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)

Modifier et exécuter le code