CommencerCommencer gratuitement

Optimisation du CV : préparation de l'ensemble de données

Dans cet exercice, vous allez préparer le jeu de données Stanford Cars pour l'entraînement. Cela impliquera l'utilisation de la bibliothèque datasets pour diviser l'ensemble de données et appliquer les transformations de prétraitement. L'ensemble de données comprend 8 000 images étiquetées de 196 modèles de voitures :

un exemple de voiture issu de l'ensemble de données

L'ensemble de données a été chargé sous le nom « dataset ». Les transformations ont été définies pour vous sous le nom d'transforms et consistent en une renormalisation et une conversion de type.

Cet exercice fait partie du cours

Modèles multimodaux avec Hugging Face

Afficher le cours

Instructions

  • Créez une division 80/20 entre l'entraînement et le test à partir de dataset en utilisant la méthode .train_test_split().
  • Veuillez appliquer les transformations (transforms) à data_splits.
  • Tracez l'image augmentée à partir du premier ensemble de valeurs de pixels dans l'dataset_transformed.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)

# Apply the transformations
dataset_transformed = ____

# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()
Modifier et exécuter le code