LoslegenKostenlos starten

Faster R-CNN-Modell

Deine nächste Aufgabe ist es, ein Faster R-CNN-Modell zu bauen, das Objekte unterschiedlicher Größe in einem Bild erkennen kann. Dafür verwendest du die praktische Klasse MultiScaleRoIAlign() aus torchvision.ops.

Die Klasse FasterRCNN wurde aus torchvision.models.detection importiert. Dein anchor_generator aus der letzten Übung ist in deinem Workspace verfügbar und torch, torch.nn als nn sowie torchvision wurden importiert.

Diese Übung ist Teil des Kurses

<Kurs>Deep Learning für Bilder mit PyTorch</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere MultiScaleRoIAlign aus torchvision.ops.
  • Instanziiere den RoI-Pooler mit MultiScaleRoIAlign, wobei featmap_names auf ["0"], output_size auf 7 und sampling_ratio auf 2 gesetzt ist.
  • Erstelle das Faster R-CNN-Modell und übergib backbone, num_class für eine binäre Klassifikation, anchor_generator und roi_pooler.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)
Code bearbeiten und ausführen