CommencerCommencer gratuitement

PyTorch DataLoader

Bravo pour la définition de la classe Dataset ! Le WaterDataset que vous venez de créer est maintenant prêt à l’emploi.

L’étape suivante pour préparer les données d’entraînement consiste à configurer un DataLoader. Un DataLoader PyTorch peut être créé à partir d’un Dataset pour charger les données, les découper en lots (batches) et appliquer, si besoin, des transformations. Il fournit ensuite un échantillon de données prêt pour l’entraînement.

Dans cet exercice, vous allez construire un DataLoader à partir de WaterDataset. La classe DataLoader dont vous aurez besoin a déjà été importée pour vous depuis torch.utils.data. Allons-y !

Cet exercice fait partie du cours

Deep learning intermédiaire avec PyTorch

Afficher le cours

Instructions

  • Créez une instance de WaterDataset à partir de water_train.csv et affectez-la à dataset_train.
  • Créez dataloader_train à partir de dataset_train, avec une taille de lot de deux et en mélangeant les échantillons.
  • Récupérez un lot de variables explicatives (features) et de labels depuis le DataLoader et affichez-les.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create an instance of the WaterDataset
dataset_train = ____(____)

# Create a DataLoader based on dataset_train
dataloader_train = ____(
    ____,
    batch_size=____,
    shuffle=____,
)

# Get a batch of features and labels
features, labels = ____
print(features, labels)
Modifier et exécuter le code