Blocco di regressione per i box
Il tuo compito finale è creare un blocco di regressione per prevedere le coordinate dei bounding box. Decidi di usare un blocco con 2 livelli completamente connessi con un’attivazione ReLU in mezzo, simile al classificatore che hai definito in precedenza.
I tuoi vgg_model e input_dim sono ancora disponibili e torch e torchvision.models sono già stati importati.
Questo esercizio fa parte del corso
Deep Learning per Immagini con PyTorch
Istruzioni dell'esercizio
- Crea una variabile
num_coordinatescon il numero di coordinate del bounding box da prevedere. - Definisci la dimensione di input appropriata per il primo livello lineare e imposta la dimensione di output a
32. - Definisci la dimensione di output appropriata nell’ultimo livello del regressore.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define the number of coordinates
____
bb = nn.Sequential(
# Add input and output dimensions
nn.Linear(____, ____),
nn.ReLU(),
# Add the output for the last regression layer
nn.Linear(32, ____),
)