LoslegenKostenlos loslegen

Block für Box-Regression

Deine letzte Aufgabe ist es, einen Regressor-Block zu erstellen, der die Koordinaten von Bounding Boxes vorhersagt. Du entscheidest dich für einen Block mit 2 vollständig verbundenen Schichten (Fully Connected) mit einer ReLU-Aktivierung dazwischen – ähnlich wie beim Klassifikator, den du zuvor definiert hast.

Dein vgg_model und input_dim sind weiterhin verfügbar und torch sowie torchvision.models wurden importiert.

Diese Übung ist Teil des Kurses

Deep Learning für Bilder mit PyTorch

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Variable num_coordinates mit der Anzahl der zu prognostizierenden Bounding-Box-Koordinaten.
  • Definiere die passende Eingabedimension für die erste lineare Schicht und setze die Ausgabedimension auf 32.
  • Definiere die passende Ausgabedimension in der letzten Schicht des Regressors.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define the number of coordinates
____

bb = nn.Sequential(  
	# Add input and output dimensions
	nn.Linear(____, ____),
	nn.ReLU(),
	# Add the output for the last regression layer
	nn.Linear(32, ____),
)
Code bearbeiten und ausführen