1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing in Python

Connected

cvičení

Nalezení optimální hloubky stromu

Teď doladíš parametr max_depth rozhodovacího stromu, abys našel/a takovou hodnotu, která omezí přeučení a zároveň zachová dobré výkonnostní metriky modelu. Pomocí cyklu for projdeš několik hodnot parametru max_depth, pro každou natrénuješ rozhodovací strom a vypočítáš výkonnostní metriky.

Seznam depth_list s kandidáty parametru je připravený. Pole depth_tuning je předpřipraveno se 2 sloupci – první obsahuje kandidáty hloubky, druhý slouží jako místo pro recall skóre. Příznaky a cílové proměnné jsou načteny jako train_X, train_Y pro trénovací data a test_X, test_Y pro testovací data. Knihovny numpy a pandas jsou dostupné pod zkratkami np a pd.

Pokyny

100 XP
  • Spusť cyklus for přes rozsah od 0 do délky seznamu depth_list.
  • Pro každého kandidáta hloubky inicializuj a natrénuj klasifikátor rozhodovacího stromu a předpověz odchod zákazníků na testovacích datech.
  • Pro každého kandidáta hloubky vypočítej recall skóre pomocí funkce recall_score() a ulož ho do druhého sloupce pole depth_tunning.
  • Vytvoř pandas DataFrame z pole depth_tuning s odpovídajícími názvy sloupců.