1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Normalizacja

Jak omówiono w filmie, normalizacja polega na liniowym skalowaniu całej kolumny do zakresu od 0 do 1, gdzie 0 odpowiada najniższej wartości w kolumnie, a 1 – najwyższej.
W bibliotece scikit-learn (najpopularniejszej bibliotece do uczenia maszynowego w Pythonie) możesz użyć MinMaxScaler, aby zastosować normalizację. (Nazwa pochodzi stąd, że wartości są skalowane między wartością minimalną a maksymalną.)

Instrukcje

100 XP
  • Zaimportuj MinMaxScaler z modułu preprocessing biblioteki sklearn.
  • Utwórz instancję MinMaxScaler() i przypisz ją do zmiennej MM_scaler.
  • Dopasuj MinMaxScaler do kolumny Age ze zbioru danych so_numeric_df.
  • Przekształć tę samą kolumnę przy użyciu dopasowanego skalera.