Bild mit einer Maske segmentieren

Mit der binären Maske kannst du jetzt das Objekt – also die Katze – aus dem Bild segmentieren.

Dazu lädst du das Originalbild und wandelst es in einen Tensor um. Danach erstellst du den Objekt-Tensor, indem du das Originalbild maskierst. Zum Schluss zeigst du das Ergebnis an.

transforms aus torchvision wurden importiert, und die binary_mask, die du in der vorherigen Übung erstellt hast, steht dir zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Deep Learning für Bilder mit PyTorch</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle image_tensor, indem du die ToTensor()-Transformation, definiert als transform, auf das Rohbild anwendest.
Segmente das Bild, indem du den image_tensor mit der binary_mask maskierst, und weise das Ergebnis object_tensor zu.
Wende die bereits definierte to_pil_image-Transformation auf den object_tensor an, um ihn anzuzeigen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load image and transform to tensor
image = Image.open("images/Egyptian_Mau_123.jpg")
transform = transforms.Compose([transforms.ToTensor()])
image_tensor = ____

# Segment object out of the image
object_tensor = ____

# Convert segmented object to image and display
to_pil_image = ____
object_image = to_pil_image(object_tensor)
plt.imshow(object_image)
plt.show()

Code bearbeiten und ausführen