Segmenteren met een voorgetrainde Mask R-CNN
In deze oefening gebruik je het voorgetrainde Mask R-CNN-model om instance segmentation uit te voeren op de volgende afbeelding met twee katten.

Het model dat je gaat gebruiken is voorgetraind op de COCO-dataset, die afbeeldingen bevat van veelvoorkomende objecten, waaronder dieren. Dankzij deze voortraining kan het model katten direct herkennen, zonder dat je het hoeft te fine-tunen.
Jouw taak is om het model en de afbeelding met de twee katten te laden, de afbeelding voor te bereiden en deze aan het model door te geven om de voorspellingen te krijgen. Image uit PIL, torch, transforms uit torchvision, en maskrcnn_resnet50_fpn zijn al voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Deep Learning voor afbeeldingen met PyTorch
Oefeninstructies
- Laad de
pretrainedMask R-CNN inmodelmetmaskrcnn_resnet50_fpn(). - Zet de afbeelding met de twee katten om naar een tensor en pas
unsqueezetoe. - Voer inferentie uit door de afbeelding aan het model door te geven en wijs de uitvoer toe aan
prediction.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load a pre-trained Mask R-CNN model
model = ____(____)
model.eval()
# Load an image and convert to a tensor
image = Image.open("two_cats.jpg")
transform = transforms.Compose([transforms.ToTensor()])
image_tensor = transform(image).____
# Perform inference
with torch.no_grad():
prediction = ____
print(prediction)