1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în analitica predictivă în Python

Connected

exercițiu

Construirea curbelor AUC

Procedura de selecție forward stepwise a variabilelor oferă o ordine în care variabilele sunt adăugate optim în setul de predictori. Pentru a decide unde să tai lista de variabile, poți construi curbele AUC pe datele de antrenament și de testare. Aceste curbe reprezintă grafic valorile AUC folosind prima variabilă, primele două, primele trei… variabile incluse în model.

În acest exercițiu vei învăța să trasezi aceste curbe AUC. Metoda auc_train_test pentru calculul valorilor AUC a fost deja implementată și poate fi folosită astfel:

auc_train, auc_test = auc_train_test(variables, target, train, test)

unde variables este setul de variabile folosit în modelul de regresie logistică, target este o listă cu numele variabilei țintă, iar train și test sunt tabelele de bază pentru antrenament, respectiv testare.

Variabilele ordonate conform procedurii forward stepwise sunt date în lista variables. Le poți explora în consolă. În plus, au fost definite pentru tine trei liste goale:

  • auc_values_train, care va conține valorile AUC pe setul de antrenament la fiecare iterație
  • auc_values_test, care va conține valorile AUC pe setul de testare la fiecare iterație
  • variables_evaluate, care va conține variabilele evaluate la fiecare iterație

Instrucțiuni

100 XP
  • Iterează peste variabile.
  • La fiecare iterație, adaugă următoarea variabilă din variables în variables_evaluate.
  • La fiecare iterație, calculează AUC-ul pe antrenament și pe testare folosind metoda auc_train_test. DataFrame-urile train și test conțin datele de antrenament, respectiv de testare.
  • La fiecare iterație, adaugă valorile calculate în auc_values_train și auc_values_test.