1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

cvičení

Vytváření nových příznaků

Feature engineering zahrnuje také skutečné vytváření nových příznaků. Je to důležitý krok, protože model se při předpovídání opírá právě o tyto příznaky. V tomto cvičení prozkoumáš vlastnosti tří sloupců, které jsou v datech uloženy jako celá čísla, ale ve skutečnosti představují kategorické hodnoty. Jsou to: search_engine_type, product_type a advertiser_type. Pro těchto 5 sloupců — včetně device_id a site_id — vytvoříš příznaky počtu kliknutí. Ty budou sloužit jako vstupy pro pozdější predikci.

Modul pandas je dostupný jako pd a ukázkový DataFrame je načten jako df.

Pokyny

100 XP
  • Vypiš celkový počet hodnot a počet unikátních hodnot pro každý příznak ze seznamu feature_list.
  • Z příznaků v seznamu new_feature_list vytvoř nové příznaky tak, že pro každý příznak spočítáš počet kliknutí pomocí metody .transform().