Affinage CV : préparation du jeu de données
Dans cet exercice, vous allez préparer le jeu de données Stanford Cars pour l’entraînement. Vous utiliserez la bibliothèque datasets pour diviser le jeu de données et appliquer les transformations de prétraitement. Le jeu contient 8 000 images annotées de 196 modèles de voitures :

Le jeu de données a été chargé sous le nom dataset. Les transformations, définies pour vous sous le nom transforms, incluent une renormalisation et une conversion de type.
Cet exercice fait partie du cours
Modèles multimodaux avec Hugging Face
Instructions
- Créez une division entraînement/test 80/20 à partir de
datasetavec la méthode.train_test_split(). - Appliquez les transformations (
transforms) àdata_splits. - Affichez l’image augmentée à partir du premier ensemble de valeurs de pixels dans
dataset_transformed.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)
# Apply the transformations
dataset_transformed = ____
# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()