LoslegenKostenlos loslegen

Binäre Masken erstellen

Bilder für Segmentierungsaufgaben werden normalerweise mit Masken auf Pixelebene versehen. Schau dir mal dieses Bild von einer ägyptischen Mau-Katze an.

Katzenbild

In dieser und der nächsten Übung wirst du die passende Maske benutzen, um die Katze aus dem Bild herauszuschneiden. Zuerst musst du die Maske laden und binärisieren.

Image von PIL, transforms von torchvision und torch wurden schon für dich importiert.

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

  • Lade das Maskenbild, das unter „ annotations/Egyptian_Mau_123.png “ gespeichert ist, und weise es „ mask “ zu.
  • Erstelle ein „ binary_mask ” aus „ mask_tensor ”, wobei jedem Pixel, das gleich „ 1/255 ” ist, ein Tensorwert von „ 1.0 ” zugewiesen wird und die restlichen Pixel einen Tensorwert von „ 0.0 ” bekommen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load mask image
mask = ____

# Transform mask to tensor
transform = transforms.Compose([transforms.ToTensor()])
mask_tensor = transform(mask)

# Create binary mask
binary_mask = ____(
    ____, 
    ____,
    ____,
)

# Print unique mask values
print(binary_mask.unique())
Code bearbeiten und ausführen