Calcolare le previsioni

Spesso, nella pratica, ci interessa usare la regressione logistica stimata per calcolare le probabilità e costruire intervalli di confidenza per queste stime. Usando l'insieme di dati wells e il modello 'switch ~ arsenic', supponi di avere nuove osservazioni wells_test che non facevano parte del campione di training e per le quali vuoi prevedere la probabilità di passare al pozzo sicuro più vicino.

Lo farai con l'aiuto del metodo .predict().

Nota che .predict() accetta diversi argomenti:

exog - nuove osservazioni (insieme di dati di test)
transform = True - applica ai dati la formula del fit y ~ x.

Se exog non è definito, le probabilità vengono calcolate per l'insieme di training.

Il modello wells_fit e gli insiemi di dati wells e wells_test sono già caricati nell'ambiente di lavoro.

Questo esercizio fa parte del corso

Modelli lineari generalizzati in Python

Visualizza corso

Istruzioni dell'esercizio

Usando il modello stimato wells_fit, calcola le previsioni sui dati di test wells_test e salvale in prediction.
Aggiungi prediction al dataframe esistente wells_test e chiama la colonna prediction.
Usando print() visualizza le prime 5 righe di wells_test con le colonne switch, arsenic e prediction. Usa la funzione pandas head() per vedere solo le prime 5 righe.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)

# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____

# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())

Modifica ed esegui il codice