Backbone de modelo pré-treinado

É hora de construir uma arquitetura R-CNN! Você vai usar o backbone do modelo pré-treinado vgg16 para extração de features. Lembre-se também de armazenar o formato da saída do backbone, que servirá como formato de entrada para os blocos seguintes: o classificador e o regressor de caixas.

torch, torchvision, torch.nn como nn já foram importados. O modelo foi importado como vgg16 com os pesos armazenados em VGG16_Weights.

Este exercício faz parte do curso

Deep Learning para Imagens com PyTorch

Ver curso

Instruções do exercício

Carregue os pesos pré-treinados do VGG16.
Extraia in_features da primeira camada do classifier usando .children() como um bloco sequencial e armazene em input_dim.
Crie um backbone como um bloco sequencial usando features e .children().
Imprima o modelo de backbone.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load pretrained weights
vgg_model = vgg16(weights=____)

# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____

# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))

# Print the backbone model
____

Editar e executar o código