IniziaInizia gratis

Violazione della timeline

Per mostrare l'importanza della timeline, considera un esempio in cui violi la timeline e usi informazioni dal periodo del target per costruire le variabili predittive.

Nel dataframe pandas basetable ci sono due colonne: "amount_2017" è l'importo totale delle donazioni nel 2017 e "target" vale 1 se questo importo è maggiore di 30, altrimenti 0.

Costruisci un modello di regressione logistica che usi "amount_2017" come unica variabile predittiva per prevedere il target e calcola l'AUC.

Questo esercizio fa parte del corso

Analisi predittiva intermedia in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un dataframe X che contenga la variabile predittiva e un dataframe y che contenga il target.
  • Adatta il modello di regressione logistica in modo che y sia predetto a partire da X. Costruisci un modello di regressione logistica che usi amount_2017 come unica variabile predittiva e predica target.
  • Genera le predizioni per gli oggetti in X.
  • Calcola e stampa l'AUC di questo modello usando la funzione roc_auc_score.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Select the relevant predictors and the target
X = basetable[["____"]]
y = basetable[["____"]]

# Build the logistic regression model
logreg = linear_model.LogisticRegression()
logreg.____(____, ____)

# Make predictions for X
predictions = logreg.____(____)[:,1]

# Calculate and print the AUC value
auc = ____(____, ____)
print(round(auc, 2))
Modifica ed esegui il codice