Vortrainiertes Modell-Backbone
Es ist Zeit, eine R-CNN-Architektur aufzubauen! Du wirst das Backbone des vortrainierten Modells „ vgg16 “ für die Merkmalsextraktion verwenden. Denk auch daran, die Ausgangsform des Backbones zu speichern, die als Eingangsform für die nächsten Blöcke dient: den Klassifikator und den Box-Regressor.
torch``torchvision, torch.nn und nn wurden importiert.
Das Modell wurde als „ vgg16 ” importiert, wobei die Gewichte in „ VGG16_Weights ” gespeichert sind.
Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Lade die vorab trainierten VGG16-Gewichte.
- Extrahier „
in_features” aus der ersten Ebene „classifier” mit „.children()” als sequenzieller Block und speichere es als „input_dim”. - Erstell eine Grundstruktur als sequenziellen Block mit „
features“ und „.children()“. - Druck das Grundgerüst aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load pretrained weights
vgg_model = vgg16(weights=____)
# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____
# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))
# Print the backbone model
____