Block für Box-Regression
Deine letzte Aufgabe ist es, einen Regressor-Block zu erstellen, der die Koordinaten von Bounding Boxes vorhersagt. Du entscheidest dich für einen Block mit 2 vollständig verbundenen Schichten (Fully Connected) mit einer ReLU-Aktivierung dazwischen – ähnlich wie beim Klassifikator, den du zuvor definiert hast.
Dein vgg_model und input_dim sind weiterhin verfügbar und torch sowie torchvision.models wurden importiert.
Diese Übung ist Teil des Kurses
<Kurs>Deep Learning für Bilder mit PyTorch</Kurs>Übungsanweisungen
- Erstelle eine Variable
num_coordinatesmit der Anzahl der zu prognostizierenden Bounding-Box-Koordinaten. - Definiere die passende Eingabedimension für die erste lineare Schicht und setze die Ausgabedimension auf
32. - Definiere die passende Ausgabedimension in der letzten Schicht des Regressors.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Define the number of coordinates
____
bb = nn.Sequential(
# Add input and output dimensions
nn.Linear(____, ____),
nn.ReLU(),
# Add the output for the last regression layer
nn.Linear(32, ____),
)