Faster R-CNN-model

Je volgende taak is een Faster R-CNN-model bouwen dat objecten van verschillende groottes in een afbeelding kan detecteren. Voor deze taak gebruik je de handige klasse MultiScaleRoIAlign() uit torchvision.ops.

De klasse FasterRCNN is geïmporteerd uit torchvision.models.detection. Je anchor_generator uit de vorige oefening is beschikbaar in je werkruimte en torch, torch.nn als nn, en torchvision zijn geïmporteerd.

Deze oefening maakt deel uit van de cursus

Deep Learning voor afbeeldingen met PyTorch

Bekijk cursus

Oefeninstructies

Importeer MultiScaleRoIAlign uit torchvision.ops.
Maak de RoI-pooler aan met MultiScaleRoIAlign met featmap_names ingesteld op ["0"], output_size op 7 en sampling_ratio op 2.
Maak het Faster R-CNN-model aan en geef backbone, num_class voor een binaire classificatie, anchor_generator en roi_pooler door.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)

Code bewerken en uitvoeren