Binäre Masken erstellen
Bilder für Segmentierungsaufgaben werden normalerweise mit Masken auf Pixelebene versehen. Schau dir mal dieses Bild von einer ägyptischen Mau-Katze an.
In dieser und der nächsten Übung wirst du die passende Maske benutzen, um die Katze aus dem Bild herauszuschneiden. Zuerst musst du die Maske laden und binärisieren.
Image
von PIL
, transforms
von torchvision
und torch
wurden schon für dich importiert.
Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Lade das Maskenbild, das unter „
annotations/Egyptian_Mau_123.png
“ gespeichert ist, und weise es „mask
“ zu. - Erstelle ein „
binary_mask
” aus „mask_tensor
”, wobei jedem Pixel, das gleich „1/255
” ist, ein Tensorwert von „1.0
” zugewiesen wird und die restlichen Pixel einen Tensorwert von „0.0
” bekommen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load mask image
mask = ____
# Transform mask to tensor
transform = transforms.Compose([transforms.ToTensor()])
mask_tensor = transform(mask)
# Create binary mask
binary_mask = ____(
____,
____,
____,
)
# Print unique mask values
print(binary_mask.unique())