1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Deep Learning with PyTorch

Connected

cvičení

PyTorch Dataset

Čas si osvěžit znalosti PyTorch Datasetů!

Než začne trénování modelu, je potřeba data načíst a předat modelu ve správném formátu. V PyTorchi se o to starají Datasety a DataLoadery. Začneme vytvořením PyTorch Datasetu pro data o kvalitě pitné vody.

V tomto cvičení definuješ třídu WaterDataset, která načte data z CSV souboru. K tomu budeš muset implementovat tři metody, které PyTorch od Datasetu očekává:

  • .__init__() pro načtení dat,
  • .__len__() pro vrácení velikosti dat,
  • .__getitem()__ pro extrakci příznaků a štítku pro jeden vzorek.

Následující importy už jsou připravené za tebe:

import pandas as pd
from torch.utils.data import Dataset

Pokyny 1/3

undefined XP
    1
    2
    3
  • V metodě .__init__() načti data z csv_path do pandas DataFrame a přiřaď ho do df.
  • Převeď df na NumPy pole a výsledek přiřaď do self.data.