1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy predykcyjnej w Pythonie

Connected

ćwiczenie

Tworzenie krzywych AUC

Procedura krokowej selekcji zmiennych w przód wyznacza kolejność, w jakiej zmienne są optymalnie dodawane do zbioru predyktorów. Aby zdecydować, ile zmiennych uwzględnić w modelu, możesz wyrysować krzywe AUC dla danych treningowych i testowych. Krzywe te przedstawiają wartości AUC obliczone kolejno dla pierwszej zmiennej, dwóch pierwszych, trzech pierwszych itd.

W tym ćwiczeniu nauczysz się rysować te krzywe AUC. Metoda auc_train_test służąca do obliczania wartości AUC została już zaimplementowana i można jej używać w następujący sposób:

auc_train, auc_test = auc_train_test(variables, target, train, test)

gdzie variables to zbiór zmiennych użytych w modelu regresji logistycznej, target to lista zawierająca nazwę zmiennej docelowej, a train i test to odpowiednio treningowa i testowa tabela bazowa.

Zmienne uporządkowane zgodnie z procedurą krokową w przód znajdują się na liście variables. Możesz ją przejrzeć w konsoli. Dodatkowo zdefiniowano dla ciebie trzy puste listy:

  • auc_values_train – będzie zawierać wartości AUC modelu na danych treningowych w każdej iteracji
  • auc_values_test – będzie zawierać wartości AUC modelu na danych testowych w każdej iteracji
  • variables_evaluate – będzie zawierać zmienne uwzględniane w każdej iteracji

Instrukcje

100 XP
  • Przejdź przez wszystkie zmienne w pętli.
  • W każdej iteracji dodaj kolejną zmienną z listy variables do listy variables_evaluate.
  • W każdej iteracji oblicz wartości AUC dla danych treningowych i testowych, używając metody auc_train_test. Ramki danych train i test zawierają odpowiednio dane treningowe i testowe.
  • W każdej iteracji dodaj obliczone wartości do list auc_values_train i auc_values_test.