Wyznaczanie optymalnego współczynnika kary L1

Teraz dostroisz parametr C dla regularyzacji L1, aby znaleźć wartość, która zmniejsza złożoność modelu przy jednoczesnym zachowaniu dobrych metryk wydajności. Uruchomisz pętlę for po możliwych wartościach C i dla każdej z nich zbudujesz instancję regresji logistycznej oraz obliczysz metryki wydajności.

Lista C zawierająca możliwe wartości została już utworzona. Tablica l1_metrics ma 3 kolumny: pierwsza przechowuje wartości C, a dwie kolejne są miejscami na liczbę niezerowych współczynników oraz wartość recall modelu. Przeskalowane cechy i zmienne docelowe zostały wczytane jako train_X, train_Y do trenowania oraz test_X, test_Y do testowania.

Biblioteki numpy i pandas są dostępne jako np i pd, a funkcja recall_score została zaimportowana z sklearn.

Uruchom pętlę for po zakresie od 0 do długości listy C.
Dla każdego kandydata C zainicjalizuj i dopasuj regresję logistyczną, a następnie przewidź rezygnację klientów na danych testowych.
Dla każdego kandydata C zapisz liczbę niezerowych współczynników oraz wartość recall odpowiednio w drugiej i trzeciej kolumnie tablicy l1_metrics.
Utwórz ramkę danych pandas z tablicy l1_metrics, używając odpowiednich nazw kolumn.

ćwiczenie

Wyznaczanie optymalnego współczynnika kary L1

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie