ComeçarComece de graça

Criando máscaras binárias

Imagens para tarefas de segmentação geralmente são anotadas com máscaras em nível de pixel. Considere esta imagem de um gato Egyptian Mau.

cat image

Neste e no próximo exercício, você usará a máscara correspondente para segmentar o gato da imagem. Primeiro, você precisará carregar a máscara e binarizá-la.

Image de PIL, transforms de torchvision e torch já foram importados para você.

Este exercício faz parte do curso

Deep Learning para Imagens com PyTorch

Ver curso

Instruções do exercício

  • Carregue a imagem de máscara armazenada em annotations/Egyptian_Mau_123.png e atribua-a a mask.
  • Crie uma binary_mask a partir de mask_tensor em que cada pixel igual a 1/255 receba um valor de tensor 1.0, e os demais pixels recebam um valor de tensor 0.0.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load mask image
mask = ____

# Transform mask to tensor
transform = transforms.Compose([transforms.ToTensor()])
mask_tensor = transform(mask)

# Create binary mask
binary_mask = ____(
    ____, 
    ____,
    ____,
)

# Print unique mask values
print(binary_mask.unique())
Editar e executar o código