Ajuste del CV: preparación del conjunto de datos
En este ejercicio, prepararás el conjunto de datos Stanford Cars para el entrenamiento. Para ello, se utilizará la biblioteca datasets para dividir el conjunto de datos y aplicar las transformaciones de preprocesamiento. El conjunto de datos consta de 8000 imágenes etiquetadas de 196 modelos de automóviles:

El conjunto de datos se ha cargado como dataset. Las transformaciones se han definido para ti como « transforms » y consisten en renormalización y conversión de tipos.
Este ejercicio forma parte del curso
Modelos multimodales con Hugging Face
Instrucciones del ejercicio
- Crea una división 80/20 entre entrenamiento y prueba a partir de
datasetutilizando el método.train_test_split(). - Aplica las transformaciones (
transforms) adata_splits. - Grafica la imagen aumentada a partir del primer conjunto de valores de píxeles en
dataset_transformed.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)
# Apply the transformations
dataset_transformed = ____
# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()