Criando máscaras binárias

Imagens para tarefas de segmentação geralmente são anotadas com máscaras em nível de pixel. Considere esta imagem de um gato Egyptian Mau.

cat image

Neste e no próximo exercício, você usará a máscara correspondente para segmentar o gato da imagem. Primeiro, você precisará carregar a máscara e binarizá-la.

Image de PIL, transforms de torchvision e torch já foram importados para você.

Este exercício faz parte do curso

Deep Learning para Imagens com PyTorch

Ver curso

Instruções do exercício

Carregue a imagem de máscara armazenada em annotations/Egyptian_Mau_123.png e atribua-a a mask.
Crie uma binary_mask a partir de mask_tensor em que cada pixel igual a 1/255 receba um valor de tensor 1.0, e os demais pixels recebam um valor de tensor 0.0.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load mask image
mask = ____

# Transform mask to tensor
transform = transforms.Compose([transforms.ToTensor()])
mask_tensor = transform(mask)

# Create binary mask
binary_mask = ____(
    ____, 
    ____,
    ____,
)

# Print unique mask values
print(binary_mask.unique())

Editar e executar o código