LoslegenKostenlos loslegen

Vortrainiertes Modell-Backbone

Es ist Zeit, eine R-CNN-Architektur aufzubauen! Du wirst das Backbone des vortrainierten Modells „ vgg16 “ für die Merkmalsextraktion verwenden. Denk auch daran, die Ausgangsform des Backbones zu speichern, die als Eingangsform für die nächsten Blöcke dient: den Klassifikator und den Box-Regressor.

torch``torchvision, torch.nn und nn wurden importiert. Das Modell wurde als „ vgg16 ” importiert, wobei die Gewichte in „ VGG16_Weights ” gespeichert sind.

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

  • Lade die vorab trainierten VGG16-Gewichte.
  • Extrahier „ in_features ” aus der ersten Ebene „ classifier ” mit „ .children() ” als sequenzieller Block und speichere es als „ input_dim ”.
  • Erstell eine Grundstruktur als sequenziellen Block mit „ features “ und „ .children() “.
  • Druck das Grundgerüst aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load pretrained weights
vgg_model = vgg16(weights=____)

# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____

# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))

# Print the backbone model
____
Code bearbeiten und ausführen