Segmenteren met een voorgetrainde Mask R-CNN

In deze oefening gebruik je het voorgetrainde Mask R-CNN-model om instance segmentation uit te voeren op de volgende afbeelding met twee katten.

two cats image

Het model dat je gaat gebruiken is voorgetraind op de COCO-dataset, die afbeeldingen bevat van veelvoorkomende objecten, waaronder dieren. Dankzij deze voortraining kan het model katten direct herkennen, zonder dat je het hoeft te fine-tunen.

Jouw taak is om het model en de afbeelding met de twee katten te laden, de afbeelding voor te bereiden en deze aan het model door te geven om de voorspellingen te krijgen. Image uit PIL, torch, transforms uit torchvision, en maskrcnn_resnet50_fpn zijn al voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Deep Learning voor afbeeldingen met PyTorch

Bekijk cursus

Oefeninstructies

Laad de pretrained Mask R-CNN in model met maskrcnn_resnet50_fpn().
Zet de afbeelding met de twee katten om naar een tensor en pas unsqueeze toe.
Voer inferentie uit door de afbeelding aan het model door te geven en wijs de uitvoer toe aan prediction.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Load a pre-trained Mask R-CNN model
model = ____(____)
model.eval()

# Load an image and convert to a tensor
image = Image.open("two_cats.jpg")
transform = transforms.Compose([transforms.ToTensor()])
image_tensor = transform(image).____

# Perform inference
with torch.no_grad():
    prediction = ____
    print(prediction)

Code bewerken en uitvoeren