Aan de slagGa gratis aan de slag

PyTorch-gegevensset

Tijd om je kennis van PyTorch Datasets op te frissen!

Voordat je met het trainen van een model kunt beginnen, moet je de data laden en in het juiste formaat aan het model doorgeven. In PyTorch gebeurt dit met Datasets en DataLoaders. Laten we beginnen met het bouwen van een PyTorch Dataset voor onze waterdrinkbaarheid-data.

In deze oefening definieer je een klasse WaterDataset om de data uit een CSV-bestand te laden. Hiervoor implementeer je de drie methoden die PyTorch van een Dataset verwacht:

  • .__init__() om de data te laden,
  • .__len__() om de grootte van de data terug te geven,
  • .__getitem()__ om features en label voor één sample op te halen.

De volgende imports die je nodig hebt, zijn al voor je gedaan:

import pandas as pd
from torch.utils.data import Dataset

Deze oefening maakt deel uit van de cursus

Gevorderde Deep Learning met PyTorch

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

class WaterDataset(Dataset):
    def __init__(self, csv_path):
        super().__init__()
        # Load data to pandas DataFrame
        df = ____
        # Convert data to a NumPy array and assign to self.data
        ____ = ____.____
Code bewerken en uitvoeren