Violazione della timeline
Per mostrare l'importanza della timeline, considera un esempio in cui violi la timeline e usi informazioni dal periodo del target per costruire le variabili predittive.
Nel dataframe pandas basetable ci sono due colonne: "amount_2017" è l'importo totale delle donazioni nel 2017 e "target" vale 1 se questo importo è maggiore di 30, altrimenti 0.
Costruisci un modello di regressione logistica che usi "amount_2017" come unica variabile predittiva per prevedere il target e calcola l'AUC.
Questo esercizio fa parte del corso
Analisi predittiva intermedia in Python
Istruzioni dell'esercizio
- Crea un dataframe
Xche contenga la variabile predittiva e un dataframeyche contenga il target. - Adatta il modello di regressione logistica in modo che
ysia predetto a partire daX. Costruisci un modello di regressione logistica che usiamount_2017come unica variabile predittiva e predicatarget. - Genera le predizioni per gli oggetti in
X. - Calcola e stampa l'AUC di questo modello usando la funzione
roc_auc_score.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Select the relevant predictors and the target
X = basetable[["____"]]
y = basetable[["____"]]
# Build the logistic regression model
logreg = linear_model.LogisticRegression()
logreg.____(____, ____)
# Make predictions for X
predictions = logreg.____(____)[:,1]
# Calculate and print the AUC value
auc = ____(____, ____)
print(round(auc, 2))