1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Standardizarea

Deși normalizarea poate fi utilă pentru scalarea unei coloane între două valori, este dificil să compari două coloane scalate dacă cel puțin una dintre ele este puternic influențată de valori extreme (outlieri). O soluție des folosită în astfel de situații este standardizarea: în loc să impui o limită superioară și una inferioară stricte, centrezi datele în jurul mediei și calculezi numărul de abateri standard față de medie pentru fiecare punct de date.

Instrucțiuni

100 XP
  • Importă StandardScaler din modulul preprocessing al bibliotecii sklearn.
  • Inițializează StandardScaler() ca SS_scaler.
  • Antrenează StandardScaler pe coloana Age din so_numeric_df.
  • Transformă aceeași coloană folosind scalarul pe care tocmai l-ai antrenat.