Lebenslauf optimieren: Datensatz vorbereiten
In dieser Übung machst du den Stanford Cars-Datensatz für das Training klar. Dazu wird die Bibliothek „ datasets “ verwendet, um den Datensatz aufzuteilen und die Vorverarbeitungstransformationen anzuwenden. Der Datensatz hat 8.000 beschriftete Bilder von 196 Automodellen:

Der Datensatz wurde als „ dataset “ geladen. Die Transformationen wurden für dich als „ transforms “ definiert und bestehen aus Renormierung und Typkonvertierung.
Diese Übung ist Teil des Kurses
Multimodale Modelle mit Hugging Face
Anleitung zur Übung
- Mach eine 80/20-Aufteilung für Training und Test aus „
dataset” mit der Methode „.train_test_split()”. - Wende die Transformationen (
transforms) aufdata_splitsan. - Zeichne das erweiterte Bild aus dem ersten Satz von Pixelwerten in „
dataset_transformed“ auf.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)
# Apply the transformations
dataset_transformed = ____
# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()