LoslegenKostenlos starten

Block für Box-Regression

Deine letzte Aufgabe ist es, einen Regressor-Block zu erstellen, der die Koordinaten von Bounding Boxes vorhersagt. Du entscheidest dich für einen Block mit 2 vollständig verbundenen Schichten (Fully Connected) mit einer ReLU-Aktivierung dazwischen – ähnlich wie beim Klassifikator, den du zuvor definiert hast.

Dein vgg_model und input_dim sind weiterhin verfügbar und torch sowie torchvision.models wurden importiert.

Diese Übung ist Teil des Kurses

<Kurs>Deep Learning für Bilder mit PyTorch</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle eine Variable num_coordinates mit der Anzahl der zu prognostizierenden Bounding-Box-Koordinaten.
  • Definiere die passende Eingabedimension für die erste lineare Schicht und setze die Ausgabedimension auf 32.
  • Definiere die passende Ausgabedimension in der letzten Schicht des Regressors.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Define the number of coordinates
____

bb = nn.Sequential(  
	# Add input and output dimensions
	nn.Linear(____, ____),
	nn.ReLU(),
	# Add the output for the last regression layer
	nn.Linear(32, ____),
)
Code bearbeiten und ausführen