1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Ordinální kódování DataFrame

Kategorické příznaky lze kódovat dvěma způsoby: one-hot kódováním a ordinálním kódováním. Při one-hot kódování se každá kategorie stane sloupcem a příslušný sloupec kategorie daného řádku nabývá hodnoty 1, ostatní 0. Při ordinálním kódování se kategorie mapují na celočíselné hodnoty od 0 po počet kategorií.

V tomto cvičení budeš procházet všechny sloupce DataFrame users a ordinálně zakódovat jejich kategorie. Encoder pro každý sloupec uložíš do slovníku ordinal_enc_dict, aby bylo možné zakódované sloupce převést zpět na původní kategorie.

Pokyny

100 XP
  • Definuj prázdný slovník ordinal_enc_dict.
  • Pro každý sloupec vytvoř objekt Ordinal Encoderu.
  • Vyber nenulové hodnoty sloupce v users a zakóduj je.
  • Přiřaď zakódované hodnoty zpět nenulových hodnotám každého sloupce (col_name) v users.