ComeçarComece de graça

Ajustes no currículo: preparação do conjunto de dados

Neste exercício, você vai preparar o conjunto de dados Stanford Cars para o treinamento. Isso vai envolver usar a biblioteca datasets pra dividir o conjunto de dados e aplicar as transformações de pré-processamento. O conjunto de dados tem 8 mil imagens rotuladas de 196 modelos de carros:

um carro de exemplo do conjunto de dados

O conjunto de dados foi carregado como dataset. As transformações foram definidas para você como transforms e consistem em renormalização e conversão de tipo.

Este exercício faz parte do curso

Modelos multimodais com Hugging Face

Ver curso

Instruções do exercício

  • Crie uma divisão 80/20 entre treinamento e teste a partir de dataset usando o método .train_test_split().
  • Aplique as transformações (transforms) a data_splits.
  • Plote a imagem aumentada a partir do primeiro conjunto de valores de pixels em dataset_transformed.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a train/test split within the HF dataset
data_splits = ____(test_size=____, seed=42)

# Apply the transformations
dataset_transformed = ____

# Plot the transformed image
plt.imshow(dataset_transformed["train"][0]["____"].permute(1, 2, 0))
plt.show()
Editar e executar o código