Nalezení optimálního koeficientu L1 penalizace

Teď si vyladíš parametr C pro L1 regularizaci, aby ses dostal/a k hodnotě, která snižuje složitost modelu a zároveň zachovává dobré výkonnostní metriky. Projdeš smyčkou for přes možné hodnoty C, pro každou z nich sestavíš instanci logistické regrese a vypočítáš výkonnostní metriky.

Seznam C s možnými hodnotami je připravený. Pole l1_metrics má 3 sloupce: první obsahuje hodnoty C, další dva slouží jako zástupné místo pro počet nenulových koeficientů a skóre recall modelu. Škálované příznaky a cílové proměnné jsou načteny jako train_X, train_Y pro trénování a test_X, test_Y pro testování.

Knihovny numpy a pandas jsou načteny jako np a pd, stejně tak funkce recall_score z knihovny sklearn.

Spusť smyčku for přes rozsah od 0 do délky seznamu C.
Pro každého kandidáta C inicializuj a natrénuj logistickou regresi a proveď predikci churn na testovacích datech.
Pro každého kandidáta C ulož počet nenulových koeficientů a skóre recall do druhého a třetího sloupce pole l1_metrics.
Vytvoř z pole l1_metrics DataFrame knihovny pandas s odpovídajícími názvy sloupců.

cvičení

Nalezení optimálního koeficientu L1 penalizace

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení