CV fine-tuning: gegevensset voorbereiden
In deze oefening ga je de Stanford Cars-gegevensset voorbereiden voor training. Dit houdt in dat je de datasets-bibliotheek gebruikt om de gegevensset te splitsen en de preprocessing-transformaties toe te passen. De gegevensset bevat 8k gelabelde afbeeldingen van 196 automodellen:

De gegevensset is geladen als dataset. De transformaties zijn voor je gedefinieerd als transforms, en bestaan uit normaliseren en typeconversie.
Deze oefening maakt deel uit van de cursus
Multi-modale modellen met Hugging Face
Oefeninstructies
- Maak een 80/20 train/test-split van
datasetmet de methode.train_test_split(). - Pas de transformaties (
transforms) toe opdata_splits. - Plot de geaugmenteerde afbeelding van de eerste set pixelwaarden in
dataset_transformed.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)
# Apply the transformations
dataset_transformed = ____
# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()