PyTorch DataLoader
Gute Arbeit bei der Definition der Dataset-Klasse! Das WaterDataset
, das du gerade erstellt hast, steht dir nun zur Verfügung.
Der nächste Schritt bei der Vorbereitung der Trainingsdaten ist das Einrichten eines DataLoader
. Ein PyTorch DataLoader
kann aus einem Dataset
erstellt werden, um Daten zu laden, in Batches aufzuteilen und bei Bedarf Transformationen an den Daten durchzuführen. Dann liefert er eine Datenstichprobe, die zum Training bereit ist.
In dieser Aufgabe wirst du einen DataLoader
basierend auf dem WaterDataset
erstellen. Die DataLoader
-Klasse, die du benötigst, wurde bereits aus torch.utils.data
für dich importiert. Los geht’s!
Diese Übung ist Teil des Kurses
Deep Learning mit PyTorch für Fortgeschrittene
Anleitung zur Übung
- Erstelle eine Instanz von
WaterDataset
auswater_train.csv
und weise siedataset_train
zu. - Erstelle
dataloader_train
basierend aufdataset_train
mit einer Batch-Größe von zwei und mische die Stichproben. - Hole einen Batch von Features und Labels aus dem DataLoader und gib sie aus.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create an instance of the WaterDataset
dataset_train = ____(____)
# Create a DataLoader based on dataset_train
dataloader_train = ____(
____,
batch_size=____,
shuffle=____,
)
# Get a batch of features and labels
features, labels = ____
print(features, labels)