Estructura básica del modelo preentrenado
¡Es hora de construir una arquitectura R-CNN! Utilizarás la estructura básica del modelo preentrenado « vgg16 » para la extracción de características. Recuerda también almacenar la forma de salida de la red principal, que servirá como forma de entrada para los bloques siguientes: el clasificador y el regresor de cajas.
torch``torchvision y torch.nn, así como nn, han sido importados.
El modelo se ha importado como vgg16 con los pesos almacenados en VGG16_Weights.
Este ejercicio forma parte del curso
Aprendizaje profundo para imágenes con PyTorch
Instrucciones del ejercicio
- Carga los pesos VGG16 preentrenados.
- Extrae
in_featuresde la primera capa declassifierutilizando.children()como bloque secuencial y guárdalo comoinput_dim. - Crea una columna vertebral como un bloque secuencial utilizando
featuresy.children(). - Imprime el modelo de la columna vertebral.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load pretrained weights
vgg_model = vgg16(weights=____)
# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____
# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))
# Print the backbone model
____