Optimisation du CV : préparation de l'ensemble de données
Dans cet exercice, vous allez préparer le jeu de données Stanford Cars pour l'entraînement. Cela impliquera l'utilisation de la bibliothèque datasets
pour diviser l'ensemble de données et appliquer les transformations de prétraitement. L'ensemble de données comprend 8 000 images étiquetées de 196 modèles de voitures :
L'ensemble de données a été chargé sous le nom « dataset
». Les transformations ont été définies pour vous sous le nom d'transforms
et consistent en une renormalisation et une conversion de type.
Cet exercice fait partie du cours
Modèles multimodaux avec Hugging Face
Instructions
- Créez une division 80/20 entre l'entraînement et le test à partir de
dataset
en utilisant la méthode.train_test_split()
. - Veuillez appliquer les transformations (
transforms
) àdata_splits
. - Tracez l'image augmentée à partir du premier ensemble de valeurs de pixels dans l'
dataset_transformed
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)
# Apply the transformations
dataset_transformed = ____
# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()