ComenzarEmpieza gratis

Tensores de imagen

Una empresa cafetera tiene un proyecto de detección de objetos en el que necesita anotar objetos de interés, en este caso, shots de café espresso. Has creado una lista con las coordenadas del cuadro delimitador de una imagen de un espresso. Ahora, debes convertir la imagen y las coordenadas en tensores.

torch y torchvision se han importado. torchvision.transforms se importa como transforms. La imagen se ha cargado como image utilizando Image.open() de la biblioteca PIL. Las coordenadas del cuadro delimitador se almacenan en la variable bbox.

espresso

Este ejercicio forma parte del curso

Aprendizaje profundo para imágenes con PyTorch

Ver curso

Instrucciones del ejercicio

  • Convierte el « bbox » en tensores utilizando « torch.tensor() ».
  • Reforma bbox_tensor añadiendo una dimensión de lote mediante unsqueeze(0).
  • Crea una transformación para cambiar el tamaño de image a (224) y transformarlo a un tensor de imagen sin escalar.
  • Envía tu solicitud a transform a image.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)
Editar y ejecutar código