Dataset PyTorch
È il momento di ripassare i PyTorch Dataset!
Prima di avviare l’addestramento del modello, devi caricare i dati e passarli al modello nel formato corretto. In PyTorch, questo è gestito da Dataset e DataLoader. Iniziamo costruendo un Dataset PyTorch per i nostri dati sulla potabilità dell’acqua.
In questo esercizio definirai una classe chiamata WaterDataset per caricare i dati da un file CSV. Per farlo, dovrai implementare i tre metodi che PyTorch si aspetta da un Dataset:
.__init__()per caricare i dati,.__len__()per restituire la dimensione dei dati,.__getitem()__per estrarre feature ed etichetta di un singolo campione.
I seguenti import necessari sono già stati eseguiti per te:
import pandas as pd
from torch.utils.data import Dataset
Questo esercizio fa parte del corso
Deep Learning intermedio con PyTorch
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
class WaterDataset(Dataset):
def __init__(self, csv_path):
super().__init__()
# Load data to pandas DataFrame
df = ____
# Convert data to a NumPy array and assign to self.data
____ = ____.____