Standardní škálování

Standardní škálování transformuje numerické příznaky tak, aby měly průměr 0 a rozptyl 1. V tomto cvičení provedeš standardní škálování pomocí StandardScaler() z knihovny sklearn. Nejprve vybereš pouze relevantní sloupce, na které škálování aplikuješ – a to kombinací filtrování numerických sloupců a znalosti struktury dat. Toto filtrování je již připraveno a probíhá prostřednictvím regulárních výrazů, které umožňují částečné shody řetězců. Poté použiješ fit_transform() k transformaci příslušných sloupců.

Modul pandas je dostupný jako pd a vzorový DataFrame je načtený jako df. Sloupec hour je již převeden na typ datetime a StandardScaler z sklearn.preprocessing je k dispozici.

Vyber numerické sloupce a filtruj zadané filter_cols pomocí .select_dtypes().
Aplikuj standardní škálování na relevantní sloupce: nejprve vytvoř StandardScaler() a poté použij .fit_transform().
Vypiš rozptyl nově transformovaných sloupců pomocí .var().

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení