Aan de slagGa gratis aan de slag

CV fine-tuning: gegevensset voorbereiden

In deze oefening ga je de Stanford Cars-gegevensset voorbereiden voor training. Dit houdt in dat je de datasets-bibliotheek gebruikt om de gegevensset te splitsen en de preprocessing-transformaties toe te passen. De gegevensset bevat 8k gelabelde afbeeldingen van 196 automodellen:

an example car from the dataset

De gegevensset is geladen als dataset. De transformaties zijn voor je gedefinieerd als transforms, en bestaan uit normaliseren en typeconversie.

Deze oefening maakt deel uit van de cursus

Multi-modale modellen met Hugging Face

Cursus bekijken

Oefeninstructies

  • Maak een 80/20 train/test-split van dataset met de methode .train_test_split().
  • Pas de transformaties (transforms) toe op data_splits.
  • Plot de geaugmenteerde afbeelding van de eerste set pixelwaarden in dataset_transformed.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)

# Apply the transformations
dataset_transformed = ____

# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()
Code bewerken en uitvoeren