1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Wyznaczanie optymalnej głębokości drzewa

Teraz dostrojysz parametr max_depth drzewa decyzyjnego, aby znaleźć wartość, która ogranicza przeuczenie przy jednoczesnym zachowaniu dobrej jakości modelu. Uruchomisz pętlę for iterującą po różnych wartościach parametru max_depth, dopasowując dla każdej z nich drzewo decyzyjne, a następnie obliczysz metryki jakości.

Lista depth_list z kandydatami na wartości parametru jest już wczytana. Tablica depth_tuning została przygotowana z 2 kolumnami: pierwsza zawiera kandydujące głębokości, a druga jest miejscem na wartości recall. Zmienne opisujące cechy i zmienną docelową są dostępne jako train_X, train_Y dla danych treningowych oraz test_X, test_Y dla danych testowych. Biblioteki numpy i pandas są wczytane odpowiednio jako np i pd.

Instrukcje

100 XP
  • Uruchom pętlę for iterującą po zakresie od 0 do długości listy depth_list.
  • Dla każdego kandydata na głębokość zainicjuj i dopasuj klasyfikator drzewa decyzyjnego, a następnie przewidź odpływ klientów na danych testowych.
  • Dla każdego kandydata na głębokość oblicz wartość recall za pomocą funkcji recall_score() i zapisz ją w drugiej kolumnie tablicy depth_tunning.
  • Utwórz ramkę danych pandas z tablicy depth_tuning, nadając kolumnom odpowiednie nazwy.