ComenzarEmpieza gratis

Estructura básica del modelo preentrenado

¡Es hora de construir una arquitectura R-CNN! Utilizarás la estructura básica del modelo preentrenado « vgg16 » para la extracción de características. Recuerda también almacenar la forma de salida de la red principal, que servirá como forma de entrada para los bloques siguientes: el clasificador y el regresor de cajas.

torch``torchvision y torch.nn, así como nn, han sido importados. El modelo se ha importado como vgg16 con los pesos almacenados en VGG16_Weights.

Este ejercicio forma parte del curso

Aprendizaje profundo para imágenes con PyTorch

Ver curso

Instrucciones del ejercicio

  • Carga los pesos VGG16 preentrenados.
  • Extrae in_features de la primera capa de classifier utilizando .children() como bloque secuencial y guárdalo como input_dim.
  • Crea una columna vertebral como un bloque secuencial utilizando features y .children().
  • Imprime el modelo de la columna vertebral.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Load pretrained weights
vgg_model = vgg16(weights=____)

# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____

# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))

# Print the backbone model
____
Editar y ejecutar código