Vortrainiertes Modell-Backbone
Es ist Zeit, eine R-CNN-Architektur aufzubauen! Du wirst das Backbone des vortrainierten Modells „ vgg16
“ für die Merkmalsextraktion verwenden. Denk auch daran, die Ausgangsform des Backbones zu speichern, die als Eingangsform für die nächsten Blöcke dient: den Klassifikator und den Box-Regressor.
torch``torchvision
, torch.nn
und nn
wurden importiert.
Das Modell wurde als „ vgg16
” importiert, wobei die Gewichte in „ VGG16_Weights
” gespeichert sind.
Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Lade die vorab trainierten VGG16-Gewichte.
- Extrahier „
in_features
” aus der ersten Ebene „classifier
” mit „.children()
” als sequenzieller Block und speichere es als „input_dim
”. - Erstell eine Grundstruktur als sequenziellen Block mit „
features
“ und „.children()
“. - Druck das Grundgerüst aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load pretrained weights
vgg_model = vgg16(weights=____)
# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____
# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))
# Print the backbone model
____