1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Kodowanie zmiennych kategorycznych i skalowanie zmiennych numerycznych

W tym ostatnim kroku wykonasz kodowanie one-hot na zmiennych kategorycznych, a następnie przeskalojesz kolumny numeryczne. Biblioteka pandas została wczytana jako pd, a moduł StandardScaler z sklearn.preprocessing jest już dostępny.

Nieprzetworzony zbiór danych o rezygnacji klientów z sektora telekomunikacyjnego – telco_raw – został wczytany jako DataFrame biblioteki pandas. Dostępne są też listy custid, target, categorical i numerical z nazwami kolumn, które zostały utworzone w poprzednim ćwiczeniu. Możesz zapoznać się ze zbiorem danych, eksplorując go w konsoli.

Instrukcje

100 XP
  • Wykonaj kodowanie one-hot na zmiennych kategorycznych.
  • Zainicjalizuj instancję StandardScaler.
  • Dopasuj scaler do kolumn numerycznych i przekształć je.
  • Zbuduj DataFrame na podstawie scaled_numerical.