1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing in Python

Connected

cvičení

Zakódování kategorických a škálování numerických proměnných

V tomto posledním kroku provedeš one-hot encoding kategorických proměnných a následně škálování numerických sloupců. Knihovna pandas je načtena jako pd a modul StandardScaler z sklearn.preprocessing je připraven k použití.

Surový dataset telekomunikačního churn telco_raw je načten jako pandas DataFrame spolu se seznamy custid, target, categorical a numerical, které obsahují názvy sloupců vytvořené v předchozím cvičení. Dataset si můžeš prohlédnout v konzoli.

Pokyny

100 XP
  • Proveď one-hot encoding kategorických proměnných.
  • Inicializuj instanci StandardScaler.
  • Nafituj a transformuj scaler na numerických sloupcích.
  • Vytvoř DataFrame z scaled_numerical.