1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Wyznaczanie optymalnego współczynnika kary L1

Teraz dostroisz parametr C dla regularyzacji L1, aby znaleźć wartość, która zmniejsza złożoność modelu przy jednoczesnym zachowaniu dobrych metryk wydajności. Uruchomisz pętlę for po możliwych wartościach C i dla każdej z nich zbudujesz instancję regresji logistycznej oraz obliczysz metryki wydajności.

Lista C zawierająca możliwe wartości została już utworzona. Tablica l1_metrics ma 3 kolumny: pierwsza przechowuje wartości C, a dwie kolejne są miejscami na liczbę niezerowych współczynników oraz wartość recall modelu. Przeskalowane cechy i zmienne docelowe zostały wczytane jako train_X, train_Y do trenowania oraz test_X, test_Y do testowania.

Biblioteki numpy i pandas są dostępne jako np i pd, a funkcja recall_score została zaimportowana z sklearn.

Instrukcje

100 XP
  • Uruchom pętlę for po zakresie od 0 do długości listy C.
  • Dla każdego kandydata C zainicjalizuj i dopasuj regresję logistyczną, a następnie przewidź rezygnację klientów na danych testowych.
  • Dla każdego kandydata C zapisz liczbę niezerowych współczynników oraz wartość recall odpowiednio w drugiej i trzeciej kolumnie tablicy l1_metrics.
  • Utwórz ramkę danych pandas z tablicy l1_metrics, używając odpowiednich nazw kolumn.