1. Apprendre
  2. /
  3. Cours
  4. /
  5. Apprentissage profond intermédiaire avec PyTorch

Connected

Exercice

Jeu de données PyTorch

Il est temps de rafraîchir vos connaissances sur les Datasets de PyTorch!

Avant de pouvoir entraîner un modèle, vous devez charger les données et les transmettre au modèle dans le bon format. Dans PyTorch, cela est géré par les Datasets et les DataLoaders. Commençons par construire un Dataset PyTorch pour nos données de potabilité de l'eau.

Dans cet exercice, vous allez définir une classe appelée WaterDataset pour charger les données à partir d'un fichier CSV. Pour ce faire, vous devez implémenter les trois méthodes qu'un Dataset PyTorch doit avoir :

  • .__init__() pour charger les données,
  • .__len__() pour retourner la taille des données,
  • .__getitem()__ pour extraire les caractéristiques et l'étiquette d'un seul exemple.

Les importations suivantes dont vous avez besoin ont déjà été faites pour vous :

import pandas as pd
from torch.utils.data import Dataset

Instructions 1/3

undefined XP
    1
    2
    3
  • Dans la méthode .__init__(), chargez les données de csv_path dans un DataFrame pandas et affectez-le à df.
  • Convertissez df en tableau NumPy et affectez le résultat à self.data.