Calcolare le previsioni
Spesso, nella pratica, ci interessa usare la regressione logistica stimata per calcolare le probabilità e costruire intervalli di confidenza per queste stime. Usando l'insieme di dati wells e il modello 'switch ~ arsenic', supponi di avere nuove osservazioni wells_test che non facevano parte del campione di training e per le quali vuoi prevedere la probabilità di passare al pozzo sicuro più vicino.
Lo farai con l'aiuto del metodo .predict().
Nota che .predict() accetta diversi argomenti:
exog- nuove osservazioni (insieme di dati di test)transform = True- applica ai dati la formula del fity ~ x.
Se exog non è definito, le probabilità vengono calcolate per l'insieme di training.
Il modello wells_fit e gli insiemi di dati wells e wells_test sono già caricati nell'ambiente di lavoro.
Questo esercizio fa parte del corso
Modelli lineari generalizzati in Python
Istruzioni dell'esercizio
- Usando il modello stimato
wells_fit, calcola le previsioni sui dati di testwells_teste salvale inprediction. - Aggiungi
predictional dataframe esistentewells_teste chiama la colonnaprediction. - Usando
print()visualizza le prime 5 righe diwells_testcon le colonneswitch,arseniceprediction. Usa la funzione pandashead()per vedere solo le prime 5 righe.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)
# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____
# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())