Faster R-CNN-Modell
Deine nächste Aufgabe ist es, ein Faster R-CNN-Modell zu bauen, das Objekte unterschiedlicher Größe in einem Bild erkennen kann. Dafür verwendest du die praktische Klasse MultiScaleRoIAlign() aus torchvision.ops.
Die Klasse FasterRCNN wurde aus torchvision.models.detection importiert. Dein anchor_generator aus der letzten Übung ist in deinem Workspace verfügbar und torch, torch.nn als nn sowie torchvision wurden importiert.
Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Importiere
MultiScaleRoIAlignaustorchvision.ops. - Instanziiere den RoI-Pooler mit
MultiScaleRoIAlign, wobeifeatmap_namesauf["0"],output_sizeauf7undsampling_ratioauf2gesetzt ist. - Erstelle das Faster R-CNN-Modell und übergib
backbone,num_classfür eine binäre Klassifikation,anchor_generatorundroi_pooler.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import MultiScaleRoIAlign
____
# Instantiate RoI pooler
roi_pooler = ____(
____,
____,
____,
)
mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280
# Create Faster R-CNN model
model = ____(
backbone=____
num_classes=____,
anchor_generator=____,
box_roi_pool=____,
)