1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Parallel Programming with Dask in Python

Connected

cvičení

Líné transformování trénovacích dat

Předzpracování vstupních proměnných je zásadním krokem v strojovém učení a často výrazně zlepší přesnost výsledného modelu. V posledních cvičeních bylo Spotify data předzpracováno za tebe – teď je ale důležité, abys to uměl/a udělat sám/sama.

V tomto cvičení použiješ objekt StandardScaler(), který transformuje sloupce pole tak, aby měly střední hodnotu nula a směrodatnou odchylku jedna.

Dask DataFrame se skladbami ze Spotify je v tvém prostředí dostupný jako dask_df. Obsahuje jak cílové skóre popularity, tak vstupní proměnné, které slouží k jeho předpovídání.

Pokyny

100 XP
  • Importuj třídu StandardScaler() z dask_ml.preprocessing.
  • Vyber sloupec 'popularity' z DataFrame a přiřaď ho do proměnné y.
  • Vytvoř objekt StandardScaler a natrénuj ho na datech X.
  • Použij škálovač k transformaci X.