1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

cvičení

Kódování kategorických proměnných – one-hot

Jeden ze sloupců v datasetu volunteer, category_desc, obsahuje popis kategorií pro jednotlivé dobrovolnické příležitosti. Protože jde o kategorickou proměnnou s více než dvěma kategoriemi, musíme k její numerické transformaci použít one-hot kódování. K tomu využij funkci pd.get_dummies() z pandas.

Pokyny

100 XP
  • Zavolej get_dummies() na sloupci volunteer["category_desc"], čímž vytvoříš zakódované sloupce, a výsledek ulož do proměnné category_enc.
  • Vypiš .head() proměnné category_enc a prohlédni si zakódované sloupce.