LoslegenKostenlos loslegen

Lebenslauf optimieren: Datensatz vorbereiten

In dieser Übung machst du den Stanford Cars-Datensatz für das Training klar. Dazu wird die Bibliothek „ datasets “ verwendet, um den Datensatz aufzuteilen und die Vorverarbeitungstransformationen anzuwenden. Der Datensatz hat 8.000 beschriftete Bilder von 196 Automodellen:

ein Beispielauto aus dem Datensatz

Der Datensatz wurde als „ dataset “ geladen. Die Transformationen wurden für dich als „ transforms “ definiert und bestehen aus Renormierung und Typkonvertierung.

Diese Übung ist Teil des Kurses

Multimodale Modelle mit Hugging Face

Kurs anzeigen

Anleitung zur Übung

  • Mach eine 80/20-Aufteilung für Training und Test aus „ dataset ” mit der Methode „ .train_test_split() ”.
  • Wende die Transformationen (transforms) auf data_splits an.
  • Zeichne das erweiterte Bild aus dem ersten Satz von Pixelwerten in „ dataset_transformed “ auf.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)

# Apply the transformations
dataset_transformed = ____

# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()
Code bearbeiten und ausführen