ComenzarEmpieza gratis

Ejecutar segmentación semántica

¡Buen trabajo diseñando la U-Net! Tienes a tu disposición un modelo ya preentrenado muy similar al que acabas de construir. Este modelo se ha entrenado con un gran conjunto de imágenes e incluye algunos pequeños añadidos a la arquitectura, como capas de batch norm.

Puedes instanciar el modelo con UNet(), lo que cargará los pesos preentrenados. Tu tarea es usarlo para generar máscaras de segmentación para la siguiente imagen de un coche.

car image

Image de PIL ya se ha importado por ti.

Este ejercicio forma parte del curso

Deep Learning para imágenes con PyTorch

Ver curso

Instrucciones del ejercicio

  • Instancia UNet() en una variable llamada model.
  • Carga la imagen car.jpg en una variable llamada image.
  • Genera las máscaras de segmentación pasando la imagen al modelo y aplicando squeeze(0) a la salida.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load model
model = ____
model.eval()

# Load and transform image
image = ____
transform = transforms.Compose([transforms.ToTensor()])
image_tensor = transform(image).unsqueeze(0)

# Predict segmentation mask
with torch.no_grad():
    prediction = ____

# Display mask
plt.imshow(prediction[1, :, :])
plt.show()
Editar y ejecutar código