PyTorch DataLoader
Bravo pour la définition de la classe Dataset ! Le WaterDataset que vous venez de créer est maintenant prêt à l’emploi.
L’étape suivante pour préparer les données d’entraînement consiste à configurer un DataLoader. Un DataLoader PyTorch peut être créé à partir d’un Dataset pour charger les données, les découper en lots (batches) et appliquer, si besoin, des transformations. Il fournit ensuite un échantillon de données prêt pour l’entraînement.
Dans cet exercice, vous allez construire un DataLoader à partir de WaterDataset. La classe DataLoader dont vous aurez besoin a déjà été importée pour vous depuis torch.utils.data. Allons-y !
Cet exercice fait partie du cours
Deep learning intermédiaire avec PyTorch
Instructions
- Créez une instance de
WaterDatasetà partir dewater_train.csvet affectez-la àdataset_train. - Créez
dataloader_trainà partir dedataset_train, avec une taille de lot de deux et en mélangeant les échantillons. - Récupérez un lot de variables explicatives (features) et de labels depuis le DataLoader et affichez-les.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create an instance of the WaterDataset
dataset_train = ____(____)
# Create a DataLoader based on dataset_train
dataloader_train = ____(
____,
batch_size=____,
shuffle=____,
)
# Get a batch of features and labels
features, labels = ____
print(features, labels)