PyTorch-Dataset
Zeit, dein Wissen über PyTorch-Datasets aufzufrischen!
Bevor das Modelltraining beginnen kann, musst du die Daten laden und sie dem Modell im richtigen Format übergeben. In PyTorch wird dies durch „Datasets“ und „DataLoaders“ gehandhabt. Lass uns mit dem Erstellen eines PyTorch-Datasets für unsere Wasserqualitätsdaten beginnen.
In dieser Aufgabe wirst du eine Klasse namens WaterDataset
definieren, um die Daten aus einer CSV-Datei zu laden. Dafür musst du die drei Methoden implementieren, die PyTorch von einem Dataset erwartet:
.__init__()
zum Laden der Daten,.__len__()
zur Rückgabe der Datengröße,.__getitem()__
zum Extrahieren von Merkmalen und Label für eine einzelne Stichprobe.
Die folgenden Imports, die du benötigst, wurden bereits für dich durchgeführt:
import pandas as pd
from torch.utils.data import Dataset
Diese Übung ist Teil des Kurses
Deep Learning mit PyTorch für Fortgeschrittene
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
class WaterDataset(Dataset):
def __init__(self, csv_path):
super().__init__()
# Load data to pandas DataFrame
df = ____
# Convert data to a NumPy array and assign to self.data
____ = ____.____