Estrutura básica do modelo pré-treinado
É hora de criar uma arquitetura R-CNN! Você vai usar a estrutura do modelo pré-treinado vgg16
para extrair características. Lembre-se também de salvar a forma de saída da espinha dorsal, que vai servir como forma de entrada para os blocos seguintes: o classificador e o regressor de caixa.
torch``torchvision
e torch.nn
foram importados como nn
.
O modelo foi importado como vgg16
com os pesos guardados em VGG16_Weights
.
Este exercício faz parte do curso
Aprendizado profundo para imagens com PyTorch
Instruções do exercício
- Carregue os pesos pré-treinados do VGG16.
- Extraia
in_features
da primeira camada declassifier
usando.children()
como um bloco sequencial e salve comoinput_dim
. - Crie uma estrutura como um bloco sequencial usando
features
e.children()
. - Imprima o modelo da coluna vertebral.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load pretrained weights
vgg_model = vgg16(weights=____)
# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____
# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))
# Print the backbone model
____