1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy predykcyjnej w Pythonie

Connected

ćwiczenie

Wybór kolejnej najlepszej zmiennej

Krokowa selekcja zmiennych w przód zaczyna od pustego zbioru zmiennych i przebiega etapami – w każdym kroku dodawana jest kolejna najlepsza zmienna. Aby ułatwić wdrożenie tej procedury, przygotowano dla ciebie dwie pomocne funkcje.

Funkcja auc oblicza AUC modelu dla zadanego zbioru zmiennych variables użytych jako predyktory. Funkcja next_best wyznacza, którą zmienną należy dodać w następnym kroku.

W tym ćwiczeniu poeksperymentujesz z tymi funkcjami, żeby lepiej zrozumieć ich działanie. Obliczysz AUC dla danego zbioru zmiennych, sprawdzisz, która zmienna powinna zostać dodana jako kolejna, i zweryfikujesz, czy rzeczywiście prowadzi to do optymalnego AUC.

Instrukcje

100 XP
  • Funkcja auc jest już zaimplementowana. Oblicz AUC modelu, który używa "max_gift", "mean_gift" i "min_gift" jako predyktorów. Przekaż te zmienne w postaci listy jako pierwszy argument funkcji auc.
  • Funkcja next_best jest już zaimplementowana. Wyznacz, którą zmienną należy dodać w następnym kroku, wiedząc, że w modelu są już "max_gift", "mean_gift" i "min_gift", a kandydatami do dodania są "age" i "gender_F". Pierwszy argument funkcji next_best to lista aktualnych zmiennych, a drugi – lista zmiennych kandydujących.
  • Oblicz AUC modelu, który używa "max_gift", "mean_gift", "min_gift" i "age" jako predyktorów.
  • Oblicz AUC modelu, który używa "max_gift", "mean_gift", "min_gift" i "gender_F" jako predyktorów.