Tensores de imagen

Una empresa de café tiene un proyecto de detección de objetos en el que necesita anotar objetos de interés, en este caso, espressos. Has creado una lista con las coordenadas del cuadro delimitador para una imagen de un espresso. Ahora necesitas convertir la imagen y las coordenadas en tensores.

Se han importado torch y torchvision. torchvision.transforms se ha importado como transforms. La imagen se ha cargado como image usando Image.open() de la librería PIL. Las coordenadas del cuadro delimitador están almacenadas en la variable bbox.

espresso

Este ejercicio forma parte del curso

Deep Learning para imágenes con PyTorch

Ver curso

Instrucciones del ejercicio

Convierte bbox en tensores usando torch.tensor().
Cambia la forma de bbox_tensor añadiendo una dimensión de lote con unsqueeze(0).
Crea una transformación para redimensionar image a (224) y convertirla en un tensor de imagen sin escalar.
Aplica transform a image.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Convert bbox into tensors
bbox_tensor = ____

# Add a new batch dimension
bbox_tensor = bbox_tensor.____

# Resize image and transform tensor
transform = transforms.Compose([
  transforms.____,
  transforms.____
])

# Apply transform to image
image_tensor = ____
print(image_tensor)

Editar y ejecutar código