PyTorch DataLoader
Gute Arbeit bei der Definition der Dataset-Klasse! Das WaterDataset, das du gerade erstellt hast, steht dir nun zur Verfügung.
Der nächste Schritt bei der Vorbereitung der Trainingsdaten ist das Einrichten eines DataLoader. Ein PyTorch DataLoader kann aus einem Dataset erstellt werden, um Daten zu laden, in Batches aufzuteilen und bei Bedarf Transformationen an den Daten durchzuführen. Dann liefert er eine Datenstichprobe, die zum Training bereit ist.
In dieser Aufgabe wirst du einen DataLoader basierend auf dem WaterDataset erstellen. Die DataLoader-Klasse, die du benötigst, wurde bereits aus torch.utils.data für dich importiert. Los geht’s!
Diese Übung ist Teil des Kurses
Deep Learning mit PyTorch für Fortgeschrittene
Anleitung zur Übung
- Erstelle eine Instanz von
WaterDatasetauswater_train.csvund weise siedataset_trainzu. - Erstelle
dataloader_trainbasierend aufdataset_trainmit einer Batch-Größe von zwei und mische die Stichproben. - Hole einen Batch von Features und Labels aus dem DataLoader und gib sie aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create an instance of the WaterDataset
dataset_train = ____(____)
# Create a DataLoader based on dataset_train
dataloader_train = ____(
____,
batch_size=____,
shuffle=____,
)
# Get a batch of features and labels
features, labels = ____
print(features, labels)