1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Leniwe przekształcanie danych treningowych

Przetwarzanie wstępne zmiennych wejściowych to kluczowy krok w uczeniu maszynowym, który często poprawia dokładność tworzonego modelu. W poprzednich ćwiczeniach dane Spotify były już wstępnie przetworzone, ale ważne jest, żebyś umiał(-a) zrobić to samodzielnie.

W tym ćwiczeniu użyjesz obiektu StandardScaler(), który przekształca kolumny tablicy tak, by miały średnią równą zero i odchylenie standardowe równe jeden.

Dask DataFrame z danymi Spotify jest dostępny w środowisku pod nazwą dask_df. Zawiera zarówno docelowe wyniki popularności, jak i zmienne wejściowe używane do ich przewidywania.

Instrukcje

100 XP
  • Zaimportuj klasę StandardScaler() z dask_ml.preprocessing.
  • Wybierz kolumnę 'popularity' z DataFrame i przypisz ją do zmiennej y.
  • Utwórz obiekt StandardScaler i dopasuj go do danych X.
  • Użyj skalera, aby przekształcić X.