1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Ordinální kódování kategorického sloupce

Imputace kategorických hodnot vyžaduje několik kroků navíc oproti imputaci numerických hodnot. Nejprve je potřeba převést je na číselné hodnoty, protože statistické operace nelze provádět nad řetězci.

Budeš pracovat s datasetem uživatelských profilů, který obsahuje preference a volby zákazníků zaznamenané restaurací. Dataset obsahuje pouze kategorické příznaky. V tomto cvičení převedeš kategorický sloupec 'ambience' na numerický pomocí OrdinalEncoder z knihovny sklearn. DataFrame byl načten jako users a funkce OrdinalEncoder() je také připravena k použití.

Pro přehled ti byl vypsán head() a tail() DataFramu users.

Pokyny

100 XP
  • Vytvoř objekt ordinálního enkodéru a přiřaď ho do proměnné ambience_ord_enc.
  • Vyber nenulové hodnoty sloupce 'ambience' v DataFramu users.
  • Přeformátuj ambience_not_null na tvar (-1, 1).
  • Nahraď nenulové hodnoty sloupce ambience jeho zakódovanými hodnotami.