1. Nauka
  2. /
  3. Kursy
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Kodowanie zmiennych kategorycznych – one-hot

Jedna z kolumn w zbiorze danych volunteer, o nazwie category_desc, zawiera opisy kategorii dostępnych możliwości wolontariatu. Ponieważ jest to zmienna kategoryczna z więcej niż dwiema kategoriami, do jej numerycznej transformacji należy zastosować kodowanie one-hot. Użyj funkcji pd.get_dummies() z biblioteki pandas.

Instrukcje

100 XP
  • Wywołaj get_dummies() na kolumnie volunteer["category_desc"], aby utworzyć zakodowane kolumny, i przypisz wynik do zmiennej category_enc.
  • Wyświetl .head() zmiennej category_enc, aby przyjrzeć się zakodowanym kolumnom.