Inizia subitoInizia gratis

Dataset PyTorch

È il momento di ripassare i PyTorch Dataset!

Prima di avviare l’addestramento del modello, devi caricare i dati e passarli al modello nel formato corretto. In PyTorch, questo è gestito da Dataset e DataLoader. Iniziamo costruendo un Dataset PyTorch per i nostri dati sulla potabilità dell’acqua.

In questo esercizio definirai una classe chiamata WaterDataset per caricare i dati da un file CSV. Per farlo, dovrai implementare i tre metodi che PyTorch si aspetta da un Dataset:

  • .__init__() per caricare i dati,
  • .__len__() per restituire la dimensione dei dati,
  • .__getitem()__ per estrarre feature ed etichetta di un singolo campione.

I seguenti import necessari sono già stati eseguiti per te:

import pandas as pd
from torch.utils.data import Dataset

Questo esercizio fa parte del corso

Deep Learning intermedio con PyTorch

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

class WaterDataset(Dataset):
    def __init__(self, csv_path):
        super().__init__()
        # Load data to pandas DataFrame
        df = ____
        # Convert data to a NumPy array and assign to self.data
        ____ = ____.____
Modifica ed esegui il codice