LoslegenKostenlos starten

Binäre Masken erstellen

Bilder für Segmentierungsaufgaben werden typischerweise mit Pixelmasken annotiert. Betrachte dieses Bild einer Egyptian-Mau-Katze.

cat image

In dieser und der nächsten Übung verwendest du die zugehörige Maske, um die Katze aus dem Bild zu segmentieren. Zuerst musst du die Maske laden und binarisieren.

Image aus PIL, transforms aus torchvision und torch wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

<Kurs>Deep Learning für Bilder mit PyTorch</Kurs>
Kurs ansehen

Übungsanweisungen

  • Lade das Maskenbild aus annotations/Egyptian_Mau_123.png und weise es mask zu.
  • Erzeuge aus mask_tensor eine binary_mask, bei der jedem Pixel mit dem Wert 1/255 der Tensorwert 1.0 zugewiesen wird und allen übrigen Pixeln der Tensorwert 0.0.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load mask image
mask = ____

# Transform mask to tensor
transform = transforms.Compose([transforms.ToTensor()])
mask_tensor = transform(mask)

# Create binary mask
binary_mask = ____(
    ____, 
    ____,
    ____,
)

# Print unique mask values
print(binary_mask.unique())
Code bearbeiten und ausführen