1. Nauka
  2. /
  3. Kursy
  4. /
  5. Głębokie uczenie z PyTorch – poziom średnio zaawansowany

Connected

ćwiczenie

Zbiór danych PyTorch

Czas odświeżyć wiedzę o zbiorach danych w PyTorch!

Zanim rozpocznie się trenowanie modelu, trzeba wczytać dane i przekazać je do modelu w odpowiednim formacie. W PyTorch zajmują się tym klasy Dataset i DataLoader. Zacznijmy od zbudowania zbioru danych PyTorch dla naszych danych o jakości wody.

W tym ćwiczeniu zdefiniujesz klasę WaterDataset, która wczyta dane z pliku CSV. W tym celu zaimplementujesz trzy metody, których PyTorch oczekuje od każdego zbioru danych:

  • .__init__() – do wczytania danych,
  • .__len__() – do zwracania rozmiaru zbioru danych,
  • .__getitem()__ – do wyodrębniania cech i etykiety dla pojedynczej próbki.

Następujące importy zostały już wykonane za ciebie:

import pandas as pd
from torch.utils.data import Dataset

Instrukcje 1/3

undefined XP
    1
    2
    3
  • W metodzie .__init__() wczytaj dane ze ścieżki csv_path do ramki danych pandas i przypisz wynik do zmiennej df.
  • Przekonwertuj df na tablicę NumPy i przypisz wynik do self.data.