Binäre Masken erstellen

Bilder für Segmentierungsaufgaben werden typischerweise mit Pixelmasken annotiert. Betrachte dieses Bild einer Egyptian-Mau-Katze.

cat image

In dieser und der nächsten Übung verwendest du die zugehörige Maske, um die Katze aus dem Bild zu segmentieren. Zuerst musst du die Maske laden und binarisieren.

Image aus PIL, transforms aus torchvision und torch wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

Lade das Maskenbild aus annotations/Egyptian_Mau_123.png und weise es mask zu.
Erzeuge aus mask_tensor eine binary_mask, bei der jedem Pixel mit dem Wert 1/255 der Tensorwert 1.0 zugewiesen wird und allen übrigen Pixeln der Tensorwert 0.0.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load mask image
mask = ____

# Transform mask to tensor
transform = transforms.Compose([transforms.ToTensor()])
mask_tensor = transform(mask)

# Create binary mask
binary_mask = ____(
    ____, 
    ____,
    ____,
)

# Print unique mask values
print(binary_mask.unique())

Code bearbeiten und ausführen