1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing in Python

Connected

cvičení

Nalezení optimálního koeficientu L1 penalizace

Teď si vyladíš parametr C pro L1 regularizaci, aby ses dostal/a k hodnotě, která snižuje složitost modelu a zároveň zachovává dobré výkonnostní metriky. Projdeš smyčkou for přes možné hodnoty C, pro každou z nich sestavíš instanci logistické regrese a vypočítáš výkonnostní metriky.

Seznam C s možnými hodnotami je připravený. Pole l1_metrics má 3 sloupce: první obsahuje hodnoty C, další dva slouží jako zástupné místo pro počet nenulových koeficientů a skóre recall modelu. Škálované příznaky a cílové proměnné jsou načteny jako train_X, train_Y pro trénování a test_X, test_Y pro testování.

Knihovny numpy a pandas jsou načteny jako np a pd, stejně tak funkce recall_score z knihovny sklearn.

Pokyny

100 XP
  • Spusť smyčku for přes rozsah od 0 do délky seznamu C.
  • Pro každého kandidáta C inicializuj a natrénuj logistickou regresi a proveď predikci churn na testovacích datech.
  • Pro každého kandidáta C ulož počet nenulových koeficientů a skóre recall do druhého a třetího sloupce pole l1_metrics.
  • Vytvoř z pole l1_metrics DataFrame knihovny pandas s odpovídajícími názvy sloupců.