CommencerCommencer gratuitement

Affinage CV : préparation du jeu de données

Dans cet exercice, vous allez préparer le jeu de données Stanford Cars pour l’entraînement. Vous utiliserez la bibliothèque datasets pour diviser le jeu de données et appliquer les transformations de prétraitement. Le jeu contient 8 000 images annotées de 196 modèles de voitures :

an example car from the dataset

Le jeu de données a été chargé sous le nom dataset. Les transformations, définies pour vous sous le nom transforms, incluent une renormalisation et une conversion de type.

Cet exercice fait partie du cours

Modèles multimodaux avec Hugging Face

Afficher le cours

Instructions

  • Créez une division entraînement/test 80/20 à partir de dataset avec la méthode .train_test_split().
  • Appliquez les transformations (transforms) à data_splits.
  • Affichez l’image augmentée à partir du premier ensemble de valeurs de pixels dans dataset_transformed.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)

# Apply the transformations
dataset_transformed = ____

# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()
Modifier et exécuter le code