Segmentazione con Mask R-CNN pre-addestrata

In questo esercizio userai il modello Mask R-CNN pre-addestrato per eseguire l'instance segmentation sulla seguente immagine con due gatti.

two cats image

Il modello che utilizzerai è stato pre-addestrato sul COCO dataset, che contiene immagini di oggetti comuni, inclusi animali. Grazie a questo, il modello dovrebbe essere in grado di riconoscere i gatti subito, senza bisogno di fine-tuning.

Il tuo compito è caricare il modello e l'immagine dei due gatti, preparare l'immagine e passarla al modello per ottenere le predizioni. Image da PIL, torch, transforms da torchvision e maskrcnn_resnet50_fpn sono già stati importati per te.

Questo esercizio fa parte del corso

Deep Learning per Immagini con PyTorch

Visualizza corso

Istruzioni dell'esercizio

Carica la Mask R-CNN pretrained in model usando maskrcnn_resnet50_fpn().
Trasforma l'immagine dei due gatti in un tensore ed esegui unsqueeze.
Esegui l'inferenza passando l'immagine al modello e assegna l'output a prediction.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Load a pre-trained Mask R-CNN model
model = ____(____)
model.eval()

# Load an image and convert to a tensor
image = Image.open("two_cats.jpg")
transform = transforms.Compose([transforms.ToTensor()])
image_tensor = transform(image).____

# Perform inference
with torch.no_grad():
    prediction = ____
    print(prediction)

Modifica ed esegui il codice