1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

cvičení

Převod kategorických proměnných

Protože sklearn vyžaduje na vstupu modelů numerické příznaky, je důležité zakódovat kategorické proměnné na numerické. Nejběžnější technika, tzv. „one-hot encoding", je sice přímočará, ale paměťově náročná. Proto použiješ techniku hashování, která mapuje kategorické vstupy na numerické hodnoty, a to pro každý kategorický sloupec.

Modul pandas je dostupný jako pd a ukázkový DataFrame je načtený jako df.

Pokyny

100 XP
  • Vyber kategorické sloupce filtrováním podle datového typu.
  • Aplikuj hashovací funkci na každý z kategorických sloupců.