1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Standaryzacja

Normalizacja sprawdza się przy skalowaniu kolumny do określonego przedziału, ale porównywanie dwóch znormalizowanych kolumn staje się trudne, gdy choćby jedna z nich jest silnie zaburzona przez wartości odstające. Popularnym rozwiązaniem tego problemu jest standaryzacja – zamiast wyznaczać sztywne granice, centujesz dane wokół ich średniej i wyrażasz każdy punkt jako liczbę odchyleń standardowych od tej średniej.

Instrukcje

100 XP
  • Zaimportuj StandardScaler z modułu preprocessing biblioteki sklearn.
  • Utwórz instancję StandardScaler() i przypisz ją do zmiennej SS_scaler.
  • Dopasuj StandardScaler do kolumny Age ze zbioru so_numeric_df.
  • Przekształć tę samą kolumnę za pomocą dopasowanego skalera.