ComenzarEmpieza gratis

Ajuste del CV: preparación del conjunto de datos

En este ejercicio, prepararás el conjunto de datos Stanford Cars para el entrenamiento. Para ello, se utilizará la biblioteca datasets para dividir el conjunto de datos y aplicar las transformaciones de preprocesamiento. El conjunto de datos consta de 8000 imágenes etiquetadas de 196 modelos de automóviles:

un coche de ejemplo del conjunto de datos

El conjunto de datos se ha cargado como dataset. Las transformaciones se han definido para ti como « transforms » y consisten en renormalización y conversión de tipos.

Este ejercicio forma parte del curso

Modelos multimodales con Hugging Face

Ver curso

Instrucciones del ejercicio

  • Crea una división 80/20 entre entrenamiento y prueba a partir de dataset utilizando el método .train_test_split().
  • Aplica las transformaciones (transforms) a data_splits.
  • Grafica la imagen aumentada a partir del primer conjunto de valores de píxeles en dataset_transformed.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)

# Apply the transformations
dataset_transformed = ____

# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()
Editar y ejecutar código