1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Kodowanie one-hot i zmienne dummy

Aby móc wykorzystać zmienne kategoryczne w modelu uczenia maszynowego, należy najpierw przedstawić je w sposób ilościowy. Dwa najczęściej stosowane podejścia to kodowanie one-hot oraz użycie zmiennych dummy. W tym ćwiczeniu stworzysz oba typy kodowania i porównasz otrzymane zestawy kolumn. Będziemy kontynuować pracę z tym samym DataFrame z poprzedniej lekcji, wczytanym jako so_survey_df, skupiając się na kolumnie Country.

Instrukcje 1/2

undefined XP
  • 1

    Zakoduj kolumnę Country metodą one-hot, dodając prefiks "OH" do każdej kolumny.

  • 2

    Utwórz zmienne dummy dla kolumny Country, dodając prefiks "DM" do każdej kolumny.