LoslegenKostenlos loslegen

Faster R-CNN-Modell

Deine nächste Aufgabe ist es, ein Faster R-CNN-Modell zu bauen, das Objekte unterschiedlicher Größe in einem Bild erkennen kann. Dafür verwendest du die praktische Klasse MultiScaleRoIAlign() aus torchvision.ops.

Die Klasse FasterRCNN wurde aus torchvision.models.detection importiert. Dein anchor_generator aus der letzten Übung ist in deinem Workspace verfügbar und torch, torch.nn als nn sowie torchvision wurden importiert.

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

  • Importiere MultiScaleRoIAlign aus torchvision.ops.
  • Instanziiere den RoI-Pooler mit MultiScaleRoIAlign, wobei featmap_names auf ["0"], output_size auf 7 und sampling_ratio auf 2 gesetzt ist.
  • Erstelle das Faster R-CNN-Modell und übergib backbone, num_class für eine binäre Klassifikation, anchor_generator und roi_pooler.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)
Code bearbeiten und ausführen