Faster R-CNN-Modell
Deine nächste Aufgabe ist es, ein Faster R-CNN-Modell zu bauen, das Objekte unterschiedlicher Größe in einem Bild erkennen kann. Dafür verwendest du die praktische Klasse MultiScaleRoIAlign() aus torchvision.ops.
Die Klasse FasterRCNN wurde aus torchvision.models.detection importiert. Dein anchor_generator aus der letzten Übung ist in deinem Workspace verfügbar und torch, torch.nn als nn sowie torchvision wurden importiert.
Diese Übung ist Teil des Kurses
<Kurs>Deep Learning für Bilder mit PyTorch</Kurs>Übungsanweisungen
- Importiere
MultiScaleRoIAlignaustorchvision.ops. - Instanziiere den RoI-Pooler mit
MultiScaleRoIAlign, wobeifeatmap_namesauf["0"],output_sizeauf7undsampling_ratioauf2gesetzt ist. - Erstelle das Faster R-CNN-Modell und übergib
backbone,num_classfür eine binäre Klassifikation,anchor_generatorundroi_pooler.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import MultiScaleRoIAlign
____
# Instantiate RoI pooler
roi_pooler = ____(
____,
____,
____,
)
mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280
# Create Faster R-CNN model
model = ____(
backbone=____
num_classes=____,
anchor_generator=____,
box_roi_pool=____,
)