1. Nauka
  2. /
  3. Kursy
  4. /
  5. Braki danych w Pythonie

Connected

ćwiczenie

Kodowanie porządkowe DataFrame

Cechy kategoryczne można zakodować na dwa sposoby: za pomocą kodowania one-hot oraz kodowania porządkowego. W kodowaniu one-hot każda kategoria staje się osobną kolumną – wartość 1 oznacza przynależność wiersza do danej kategorii, a 0 w pozostałych kolumnach. W kodowaniu porządkowym kategorie są mapowane na wartości całkowite, zaczynając od 0 aż do liczby kategorii.

W tym ćwiczeniu przejdziesz pętlą po wszystkich kolumnach w DataFrame users, aby zakodować kategorie porządkowo. Dla każdej kolumny zapiszesz też enkoder w słowniku ordinal_enc_dict, dzięki czemu zakodowane kolumny będzie można przekształcić z powrotem do oryginalnych kategorii.

Instrukcje

100 XP
  • Zdefiniuj pusty słownik ordinal_enc_dict.
  • Utwórz obiekt Ordinal Encoder dla każdej kolumny.
  • Wybierz niepuste wartości danej kolumny w users i zakoduj je.
  • Przypisz zakodowane wartości z powrotem do niepustych wartości każdej kolumny (col_name) w users.