Estructura básica del modelo preentrenado
¡Es hora de construir una arquitectura R-CNN! Utilizarás la estructura básica del modelo preentrenado « vgg16
» para la extracción de características. Recuerda también almacenar la forma de salida de la red principal, que servirá como forma de entrada para los bloques siguientes: el clasificador y el regresor de cajas.
torch``torchvision
y torch.nn
, así como nn
, han sido importados.
El modelo se ha importado como vgg16
con los pesos almacenados en VGG16_Weights
.
Este ejercicio forma parte del curso
Aprendizaje profundo para imágenes con PyTorch
Instrucciones del ejercicio
- Carga los pesos VGG16 preentrenados.
- Extrae
in_features
de la primera capa declassifier
utilizando.children()
como bloque secuencial y guárdalo comoinput_dim
. - Crea una columna vertebral como un bloque secuencial utilizando
features
y.children()
. - Imprime el modelo de la columna vertebral.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Load pretrained weights
vgg_model = vgg16(weights=____)
# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____
# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))
# Print the backbone model
____