Box-regressorblok
Je laatste taak is om een regressorblok te maken dat bounding-boxcoördinaten voorspelt. Je kiest voor een blok met 2 volledig verbonden lagen met daartussen een ReLU-activatie, vergelijkbaar met de classifier die je eerder hebt gedefinieerd.
Je vgg_model en input_dim zijn nog beschikbaar en torch en torchvision.models zijn geïmporteerd.
Deze oefening maakt deel uit van de cursus
Deep Learning voor afbeeldingen met PyTorch
Oefeninstructies
- Maak een variabele
num_coordinatesmet het aantal bounding-boxcoördinaten dat je wilt voorspellen. - Definieer de juiste invoerdimensie voor de eerste lineaire laag en zet de uitvoerdimensie op
32. - Definieer de juiste uitvoerdimensie in de laatste laag van de regressor.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define the number of coordinates
____
bb = nn.Sequential(
# Add input and output dimensions
nn.Linear(____, ____),
nn.ReLU(),
# Add the output for the last regression layer
nn.Linear(32, ____),
)