1. Nauka
  2. /
  3. Kursy
  4. /
  5. Praca z danymi kategorycznymi w Pythonie

Connected

ćwiczenie

One-hot encoding wybranych kolumn

Lokalne komis samochodowy potrzebuje twojej pomocy przy przewidywaniu ceny sprzedaży pojazdów. Zastosowanie one-hot encodingu do całego zbioru danych used_cars daje w efekcie ponad 1 200 kolumn. Martwisz się, że może to powodować problemy podczas trenowania modeli uczenia maszynowego do przewidywania ceny. Postanawiasz wypróbować prostsze podejście i zastosować one-hot encoding tylko na kilku kolumnach.

Instrukcje

100 XP
  • Utwórz nowy zbiór danych used_cars_simple, stosując one-hot encoding dla następujących kolumn: "manufacturer_name" i "transmission" (w tej kolejności).
  • Ustaw przedrostek wszystkich nowych kolumn na "dummy", aby móc je łatwo odfiltrować.