LoslegenKostenlos loslegen

Semantische Segmentierung ausführen

Toll gemacht mit dem Design des U-Net! Du findest ein bereits vortrainiertes Modell, das dem gerade erstellten Modell sehr ähnlich ist. Dieses Modell wurde mit einer großen Menge an Bildern trainiert und hat ein paar kleine Änderungen an der Architektur, wie zum Beispiel die Batch-Norm-Schichten.

Du kannst das Modell als „ UNet() “ instanziieren, wodurch das Modell mit den vortrainierten Gewichten versehen wird. Deine Aufgabe ist es, damit Segmentierungsmasken für das folgende Bild eines Autos zu erstellen.

Auto-Bild

Image aus „ PIL “ wurde schon für dich importiert.

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

  • Instanziere „ UNet() “ in einer Variablen namens „ model “.
  • Lade das Bild unter car.jpg in eine Variable namens image.
  • Mach Segmentierungsmasken, indem du das Bild durch das Modell schickst und die Ausgabe mit „ squeeze(0) “ bearbeitest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load model
model = ____
model.eval()

# Load and transform image
image = ____
transform = transforms.Compose([transforms.ToTensor()])
image_tensor = transform(image).unsqueeze(0)

# Predict segmentation mask
with torch.no_grad():
    prediction = ____

# Display mask
plt.imshow(prediction[1, :, :])
plt.show()
Code bearbeiten und ausführen