Box-Regressor-Block
Deine letzte Aufgabe ist es, einen Regressorblock zu erstellen, um die Koordinaten der Begrenzungsrahmen vorherzusagen. Du entscheidest dich für einen Block mit zwei komplett verbundenen Schichten und einer ReLU-Aktivierung dazwischen, ähnlich wie bei dem Klassifikator, den du vorher definiert hast.
Deine E-Mail-Adressen vgg_model
und input_dim
sind noch da und torch
und torchvision.models
wurden übernommen.
Diese Übung ist Teil des Kurses
Deep Learning für Bilder mit PyTorch
Anleitung zur Übung
- Erstell eine Variable „
num_coordinates
“ mit der Anzahl der zu prognostizierenden Koordinaten der Begrenzungsrahmen. - Leg die passende Eingabedimension für die erste lineare Schicht fest und setz die Ausgabedimension auf „
32
“. - Leg die passende Ausgabedimension in der letzten Schicht des Regressors fest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the number of coordinates
____
bb = nn.Sequential(
# Add input and output dimensions
nn.Linear(____, ____),
nn.ReLU(),
# Add the output for the last regression layer
nn.Linear(32, ____),
)