Bloco de regressão de caixas
Sua tarefa final é criar um bloco de regressão para prever as coordenadas da bounding box. Você decidiu usar um bloco com 2 camadas totalmente conectadas, com uma ativação ReLU entre elas, semelhante ao classificador que você definiu anteriormente.
Seu vgg_model e input_dim ainda estão disponíveis, e torch e torchvision.models já foram importados.
Este exercício faz parte do curso
Deep Learning para Imagens com PyTorch
Instruções do exercício
- Crie uma variável
num_coordinatescom o número de coordenadas da bounding box a serem previstas. - Defina a dimensão de entrada apropriada para a primeira camada linear e ajuste a dimensão de saída para
32. - Defina a dimensão de saída apropriada na última camada do regressor.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define the number of coordinates
____
bb = nn.Sequential(
# Add input and output dimensions
nn.Linear(____, ____),
nn.ReLU(),
# Add the output for the last regression layer
nn.Linear(32, ____),
)