Faster R-CNN-model
Je volgende taak is een Faster R-CNN-model bouwen dat objecten van verschillende groottes in een afbeelding kan detecteren. Voor deze taak gebruik je de handige klasse MultiScaleRoIAlign() uit torchvision.ops.
De klasse FasterRCNN is geïmporteerd uit torchvision.models.detection. Je anchor_generator uit de vorige oefening is beschikbaar in je werkruimte en torch, torch.nn als nn, en torchvision zijn geïmporteerd.
Deze oefening maakt deel uit van de cursus
Deep Learning voor afbeeldingen met PyTorch
Oefeninstructies
- Importeer
MultiScaleRoIAlignuittorchvision.ops. - Maak de RoI-pooler aan met
MultiScaleRoIAlignmetfeatmap_namesingesteld op["0"],output_sizeop7ensampling_ratioop2. - Maak het Faster R-CNN-model aan en geef
backbone,num_classvoor een binaire classificatie,anchor_generatorenroi_poolerdoor.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import MultiScaleRoIAlign
____
# Instantiate RoI pooler
roi_pooler = ____(
____,
____,
____,
)
mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280
# Create Faster R-CNN model
model = ____(
backbone=____
num_classes=____,
anchor_generator=____,
box_roi_pool=____,
)