Segmentazione con Mask R-CNN pre-addestrata
In questo esercizio userai il modello Mask R-CNN pre-addestrato per eseguire l'instance segmentation sulla seguente immagine con due gatti.

Il modello che utilizzerai è stato pre-addestrato sul COCO dataset, che contiene immagini di oggetti comuni, inclusi animali. Grazie a questo, il modello dovrebbe essere in grado di riconoscere i gatti subito, senza bisogno di fine-tuning.
Il tuo compito è caricare il modello e l'immagine dei due gatti, preparare l'immagine e passarla al modello per ottenere le predizioni. Image da PIL, torch, transforms da torchvision e maskrcnn_resnet50_fpn sono già stati importati per te.
Questo esercizio fa parte del corso
Deep Learning per Immagini con PyTorch
Istruzioni dell'esercizio
- Carica la Mask R-CNN
pretrainedinmodelusandomaskrcnn_resnet50_fpn(). - Trasforma l'immagine dei due gatti in un tensore ed esegui
unsqueeze. - Esegui l'inferenza passando l'immagine al modello e assegna l'output a
prediction.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load a pre-trained Mask R-CNN model
model = ____(____)
model.eval()
# Load an image and convert to a tensor
image = Image.open("two_cats.jpg")
transform = transforms.Compose([transforms.ToTensor()])
image_tensor = transform(image).____
# Perform inference
with torch.no_grad():
prediction = ____
print(prediction)