Modèle de base pré-entraîné
Il est temps de créer une architecture R-CNN. Vous utiliserez le modèle pré-entraîné vgg16
comme base pour l'extraction des caractéristiques. N'oubliez pas non plus de stocker la forme de sortie de la structure principale, qui servira de forme d'entrée pour les blocs suivants : le classificateur et le régresseur de boîtes.
torch``torchvision
et torch.nn
ont été importés en tant que nn
.
Le modèle a été importé sous le nom « vgg16
» avec les poids enregistrés dans « VGG16_Weights
».
Cet exercice fait partie du cours
Deep learning pour les images avec PyTorch
Instructions
- Chargez les poids VGG16 pré-entraînés.
- Extrayez
in_features
de la première couche de l'classifier
en utilisant.children()
comme bloc séquentiel et enregistrez-le sous le nominput_dim
. - Créez une structure principale sous forme de bloc séquentiel à l'aide de
features
et.children()
. - Imprimez le modèle de la colonne vertébrale.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load pretrained weights
vgg_model = vgg16(weights=____)
# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____
# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))
# Print the backbone model
____