IniziaInizia gratis

Dataset PyTorch

È il momento di ripassare i PyTorch Dataset!

Prima di avviare l’addestramento del modello, devi caricare i dati e passarli al modello nel formato corretto. In PyTorch, questo è gestito da Dataset e DataLoader. Iniziamo costruendo un Dataset PyTorch per i nostri dati sulla potabilità dell’acqua.

In questo esercizio definirai una classe chiamata WaterDataset per caricare i dati da un file CSV. Per farlo, dovrai implementare i tre metodi che PyTorch si aspetta da un Dataset:

  • .__init__() per caricare i dati,
  • .__len__() per restituire la dimensione dei dati,
  • .__getitem()__ per estrarre feature ed etichetta di un singolo campione.

I seguenti import necessari sono già stati eseguiti per te:

import pandas as pd
from torch.utils.data import Dataset

Questo esercizio fa parte del corso

Deep Learning intermedio con PyTorch

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

class WaterDataset(Dataset):
    def __init__(self, csv_path):
        super().__init__()
        # Load data to pandas DataFrame
        df = ____
        # Convert data to a NumPy array and assign to self.data
        ____ = ____.____
Modifica ed esegui il codice