Modello Faster R-CNN

Il tuo prossimo compito è costruire un modello Faster R-CNN che possa rilevare oggetti di diverse dimensioni in un'immagine. Per questo userai una comoda classe, MultiScaleRoIAlign(), da torchvision.ops.

La classe FasterRCNN è stata importata da torchvision.models.detection. Il tuo anchor_generator dall'esercizio precedente è disponibile nel tuo workspace e torch, torch.nn come nn e torchvision sono già stati importati.

Questo esercizio fa parte del corso

Deep Learning per Immagini con PyTorch

Visualizza corso

Istruzioni dell'esercizio

Importa MultiScaleRoIAlign da torchvision.ops.
Istanzia il RoI pooler usando MultiScaleRoIAlign con featmap_names impostato a ["0"], output_size a 7 e sampling_ratio a 2.
Crea il modello Faster R-CNN passandogli il backbone, num_class per una classificazione binaria, anchor_generator e roi_pooler.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)

Modifica ed esegui il codice