Block für Box-Regression
Deine letzte Aufgabe ist es, einen Regressor-Block zu erstellen, der die Koordinaten von Bounding Boxes vorhersagt. Du entscheidest dich für einen Block mit 2 vollständig verbundenen Schichten (Fully Connected) mit einer ReLU-Aktivierung dazwischen – ähnlich wie beim Klassifikator, den du zuvor definiert hast.
Dein vgg_model und input_dim sind weiterhin verfügbar und torch sowie torchvision.models wurden importiert.
Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Erstelle eine Variable
num_coordinatesmit der Anzahl der zu prognostizierenden Bounding-Box-Koordinaten. - Definiere die passende Eingabedimension für die erste lineare Schicht und setze die Ausgabedimension auf
32. - Definiere die passende Ausgabedimension in der letzten Schicht des Regressors.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the number of coordinates
____
bb = nn.Sequential(
# Add input and output dimensions
nn.Linear(____, ____),
nn.ReLU(),
# Add the output for the last regression layer
nn.Linear(32, ____),
)