LoslegenKostenlos loslegen

PyTorch-Dataset

Zeit, dein Wissen über PyTorch-Datasets aufzufrischen!

Bevor das Modelltraining beginnen kann, musst du die Daten laden und sie dem Modell im richtigen Format übergeben. In PyTorch wird dies durch „Datasets“ und „DataLoaders“ gehandhabt. Lass uns mit dem Erstellen eines PyTorch-Datasets für unsere Wasserqualitätsdaten beginnen.

In dieser Aufgabe wirst du eine Klasse namens WaterDataset definieren, um die Daten aus einer CSV-Datei zu laden. Dafür musst du die drei Methoden implementieren, die PyTorch von einem Dataset erwartet:

  • .__init__() zum Laden der Daten,
  • .__len__() zur Rückgabe der Datengröße,
  • .__getitem()__ zum Extrahieren von Merkmalen und Label für eine einzelne Stichprobe.

Die folgenden Imports, die du benötigst, wurden bereits für dich durchgeführt:

import pandas as pd
from torch.utils.data import Dataset

Diese Übung ist Teil des Kurses

Deep Learning mit PyTorch für Fortgeschrittene

Kurs anzeigen

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

class WaterDataset(Dataset):
    def __init__(self, csv_path):
        super().__init__()
        # Load data to pandas DataFrame
        df = ____
        # Convert data to a NumPy array and assign to self.data
        ____ = ____.____
Code bearbeiten und ausführen