Modèle de base pré-entraîné

Il est temps de créer une architecture R-CNN. Vous utiliserez le modèle pré-entraîné vgg16 comme base pour l'extraction des caractéristiques. N'oubliez pas non plus de stocker la forme de sortie de la structure principale, qui servira de forme d'entrée pour les blocs suivants : le classificateur et le régresseur de boîtes.

torch``torchvision et torch.nn ont été importés en tant que nn. Le modèle a été importé sous le nom « vgg16 » avec les poids enregistrés dans « VGG16_Weights ».

Cet exercice fait partie du cours

Deep learning pour les images avec PyTorch

Afficher le cours

Instructions

Chargez les poids VGG16 pré-entraînés.
Extrayez in_features de la première couche de l'classifier en utilisant .children() comme bloc séquentiel et enregistrez-le sous le nom input_dim.
Créez une structure principale sous forme de bloc séquentiel à l'aide de features et .children().
Imprimez le modèle de la colonne vertébrale.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load pretrained weights
vgg_model = vgg16(weights=____)

# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____

# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))

# Print the backbone model
____

Modifier et exécuter le code