PyTorch DataLoader
Goed gedaan met het definiëren van de Dataset-klasse! De WaterDataset die je zojuist hebt gemaakt, is nu beschikbaar om te gebruiken.
De volgende stap in het voorbereiden van de trainingsdata is het opzetten van een DataLoader. Een PyTorch DataLoader kan worden gemaakt op basis van een Dataset om data te laden, in batches te verdelen en desgewenst transformaties uit te voeren. Vervolgens levert hij een datasample aan dat klaar is voor training.
In deze oefening bouw je een DataLoader op basis van de WaterDataset. De DataLoader-klasse die je nodig hebt, is al voor je geïmporteerd uit torch.utils.data. Aan de slag!
Deze oefening maakt deel uit van de cursus
Gevorderde Deep Learning met PyTorch
Oefeninstructies
- Maak een instantie van
WaterDatasetuitwater_train.csven ken die toe aandataset_train. - Maak
dataloader_trainop basis vandataset_train, met een batchgrootte van twee en willekeurig schudden van de samples. - Haal een batch met features en labels uit de DataLoader en print deze.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create an instance of the WaterDataset
dataset_train = ____(____)
# Create a DataLoader based on dataset_train
dataloader_train = ____(
____,
batch_size=____,
shuffle=____,
)
# Get a batch of features and labels
features, labels = ____
print(features, labels)