ComeçarComece de graça

Estrutura básica do modelo pré-treinado

É hora de criar uma arquitetura R-CNN! Você vai usar a estrutura do modelo pré-treinado vgg16 para extrair características. Lembre-se também de salvar a forma de saída da espinha dorsal, que vai servir como forma de entrada para os blocos seguintes: o classificador e o regressor de caixa.

torch``torchvision e torch.nn foram importados como nn. O modelo foi importado como vgg16 com os pesos guardados em VGG16_Weights.

Este exercício faz parte do curso

Aprendizado profundo para imagens com PyTorch

Ver curso

Instruções do exercício

  • Carregue os pesos pré-treinados do VGG16.
  • Extraia in_features da primeira camada de classifier usando .children() como um bloco sequencial e salve como input_dim.
  • Crie uma estrutura como um bloco sequencial usando features e .children().
  • Imprima o modelo da coluna vertebral.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load pretrained weights
vgg_model = vgg16(weights=____)

# Extract the input dimension
input_dim = nn.Sequential(*list(vgg_model.classifier.____()))[0].____

# Create a backbone with convolutional layers
backbone = nn.Sequential(*list(____))

# Print the backbone model
____
Editar e executar o código