Dataset PyTorch
È il momento di ripassare i PyTorch Dataset!
Prima di avviare l’addestramento del modello, devi caricare i dati e passarli al modello nel formato corretto. In PyTorch, questo è gestito da Dataset e DataLoader. Iniziamo costruendo un Dataset PyTorch per i nostri dati sulla potabilità dell’acqua.
In questo esercizio definirai una classe chiamata WaterDataset per caricare i dati da un file CSV. Per farlo, dovrai implementare i tre metodi che PyTorch si aspetta da un Dataset:
.__init__()per caricare i dati,.__len__()per restituire la dimensione dei dati,.__getitem()__per estrarre feature ed etichetta di un singolo campione.
I seguenti import necessari sono già stati eseguiti per te:
import pandas as pd
from torch.utils.data import Dataset
Questo esercizio fa parte del corso
Deep Learning intermedio con PyTorch
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
class WaterDataset(Dataset):
def __init__(self, csv_path):
super().__init__()
# Load data to pandas DataFrame
df = ____
# Convert data to a NumPy array and assign to self.data
____ = ____.____