1. Nauka
  2. /
  3. Kursy
  4. /
  5. HR Analytics: Przewidywanie rotacji pracowników w Pythonie

Connected

ćwiczenie

Pułapka zmiennych zero-jedynkowych

Pułapka zmiennych zero-jedynkowych (ang. dummy trap) to sytuacja, w której różne zmienne zero-jedynkowe niosą tę samą informację. Na przykład: jeśli pracownik należy do działu księgowości (czyli wartość w kolumnie accounting wynosi 1), to wiadomo, że nie należy do żadnego innego działu (wszędzie indziej wartości wynoszą 0). Inaczej mówiąc, dział pracownika można ustalić na podstawie pozostałych kolumn, bez patrzenia na tę jedną.

Dlatego, gdy tworzone jest \(n\) zmiennych zero-jedynkowych (w tym przypadku 10), wystarczy \(n\) - 1 z nich (czyli 9) – informacja zawarta w \(n\)-tej kolumnie jest już uwzględniona w pozostałych.

W tym ćwiczeniu usuniesz starą kolumnę działu, pozbędziesz się jednej z nowych zmiennych zero-jedynkowych, aby uniknąć pułapki, a następnie połączysz oba obiekty DataFrame.

Instrukcje

100 XP
  • Użyj .drop(), aby usunąć kolumnę accounting i uniknąć pułapki zmiennych zero-jedynkowych.
  • Użyj .drop(), aby usunąć starą kolumnę department – nie jest już potrzebna.
  • Połącz nowy obiekt DataFrame departments ze zbiorem danych employee (ten krok jest już wykonany za ciebie).