1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

cvičení

Standardní škálování

Standardní škálování transformuje numerické příznaky tak, aby měly průměr 0 a rozptyl 1. V tomto cvičení provedeš standardní škálování pomocí StandardScaler() z knihovny sklearn. Nejprve vybereš pouze relevantní sloupce, na které škálování aplikuješ – a to kombinací filtrování numerických sloupců a znalosti struktury dat. Toto filtrování je již připraveno a probíhá prostřednictvím regulárních výrazů, které umožňují částečné shody řetězců. Poté použiješ fit_transform() k transformaci příslušných sloupců.

Modul pandas je dostupný jako pd a vzorový DataFrame je načtený jako df. Sloupec hour je již převeden na typ datetime a StandardScaler z sklearn.preprocessing je k dispozici.

Pokyny

100 XP
  • Vyber numerické sloupce a filtruj zadané filter_cols pomocí .select_dtypes().
  • Aplikuj standardní škálování na relevantní sloupce: nejprve vytvoř StandardScaler() a poté použij .fit_transform().
  • Vypiš rozptyl nově transformovaných sloupců pomocí .var().