1. Learn
  2. /
  3. Cursuri
  4. /
  5. Deep Learning intermediar cu PyTorch

Connected

exercițiu

Set de date PyTorch

Hai să îți reîmprospătezi cunoștințele despre seturile de date PyTorch!

Înainte de a putea antrena un model, trebuie să încarci datele și să le transmiți modelului în formatul potrivit. În PyTorch, de acest lucru se ocupă clasele Dataset și DataLoader. Să începem prin a construi un Dataset PyTorch pentru datele noastre despre potabilitatea apei.

În acest exercițiu, vei defini o clasă numită WaterDataset pentru a încărca datele dintr-un fișier CSV. Pentru aceasta, va trebui să implementezi cele trei metode pe care PyTorch le așteaptă de la un Dataset:

  • .__init__() pentru a încărca datele,
  • .__len__() pentru a returna dimensiunea setului de date,
  • .__getitem()__ pentru a extrage caracteristicile și eticheta unui singur eșantion.

Importurile necesare au fost deja făcute pentru tine:

import pandas as pd
from torch.utils.data import Dataset

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • În metoda .__init__(), încarcă datele din csv_path într-un DataFrame pandas și atribuie-l variabilei df.
  • Convertește df într-un array NumPy și atribuie rezultatul lui self.data.