Lebenslauf optimieren: Datensatz vorbereiten
In dieser Übung machst du den Stanford Cars-Datensatz für das Training klar. Dazu wird die Bibliothek „ datasets “ verwendet, um den Datensatz aufzuteilen und die Vorverarbeitungstransformationen anzuwenden. Der Datensatz hat 8.000 beschriftete Bilder von 196 Automodellen:

Der Datensatz wurde als „ dataset “ geladen. Die Transformationen wurden für dich als „ transforms “ definiert und bestehen aus Renormierung und Typkonvertierung.
Diese Übung ist Teil des Kurses
<Kurs>Multimodale Modelle mit Hugging Face</Kurs>Übungsanweisungen
- Mach eine 80/20-Aufteilung für Training und Test aus „
dataset” mit der Methode „.train_test_split()”. - Wende die Transformationen (
transforms) aufdata_splitsan. - Zeichne das erweiterte Bild aus dem ersten Satz von Pixelwerten in „
dataset_transformed“ auf.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)
# Apply the transformations
dataset_transformed = ____
# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()