Tensores de imagen
Una empresa de café tiene un proyecto de detección de objetos en el que necesita anotar objetos de interés, en este caso, espressos. Has creado una lista con las coordenadas del cuadro delimitador para una imagen de un espresso. Ahora necesitas convertir la imagen y las coordenadas en tensores.
Se han importado torch y torchvision. torchvision.transforms se ha importado como transforms. La imagen se ha cargado como image usando Image.open() de la librería PIL. Las coordenadas del cuadro delimitador están almacenadas en la variable bbox.

Este ejercicio forma parte del curso
Deep Learning para imágenes con PyTorch
Instrucciones del ejercicio
- Convierte
bboxen tensores usandotorch.tensor(). - Cambia la forma de
bbox_tensorañadiendo una dimensión de lote conunsqueeze(0). - Crea una transformación para redimensionar
imagea(224)y convertirla en un tensor de imagen sin escalar. - Aplica
transformaimage.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Convert bbox into tensors
bbox_tensor = ____
# Add a new batch dimension
bbox_tensor = bbox_tensor.____
# Resize image and transform tensor
transform = transforms.Compose([
transforms.____,
transforms.____
])
# Apply transform to image
image_tensor = ____
print(image_tensor)