PyTorch-gegevensset
Tijd om je kennis van PyTorch Datasets op te frissen!
Voordat je met het trainen van een model kunt beginnen, moet je de data laden en in het juiste formaat aan het model doorgeven. In PyTorch gebeurt dit met Datasets en DataLoaders. Laten we beginnen met het bouwen van een PyTorch Dataset voor onze waterdrinkbaarheid-data.
In deze oefening definieer je een klasse WaterDataset om de data uit een CSV-bestand te laden. Hiervoor implementeer je de drie methoden die PyTorch van een Dataset verwacht:
.__init__()om de data te laden,.__len__()om de grootte van de data terug te geven,.__getitem()__om features en label voor één sample op te halen.
De volgende imports die je nodig hebt, zijn al voor je gedaan:
import pandas as pd
from torch.utils.data import Dataset
Deze oefening maakt deel uit van de cursus
Gevorderde Deep Learning met PyTorch
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
class WaterDataset(Dataset):
def __init__(self, csv_path):
super().__init__()
# Load data to pandas DataFrame
df = ____
# Convert data to a NumPy array and assign to self.data
____ = ____.____