Devianza e trasformazione lineare
Come hai visto negli esercizi precedenti, la devianza diminuisce quando aggiungi una variabile che migliora l'adattamento del modello. In questo esercizio considererai l'esempio dei pozzi (well switch) e il modello che hai adattato con la variabile distance, ma valuterai cosa succede quando applichi una trasformazione lineare alla variabile.
Nota che la variabile distance100 è la variabile originale distance divisa per 100, per ottenere una rappresentazione e un'interpretazione dei risultati più significative. Puoi ispezionare i dati con wells.head() per visualizzare le prime 5 righe.
L'insieme di dati wells e il modello 'swicth ~ distance100' sono stati precaricati come model_dist.
Questo esercizio fa parte del corso
Modelli lineari generalizzati in Python
Istruzioni dell'esercizio
- Importa
statsmodelscomesme la funzioneglm(). - Adatta un modello di regressione logistica con
distancecome variabile esplicativa eswitchcome risposta e salvalo comemodel_dist_1. - Controlla e stampa la differenza di devianza tra il modello corrente e il modello con
distance100come variabile esplicativa.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import functions
import ____.api as ____
from ____.____.api import ____
# Fit logistic regression model as save as model_dist_1
model_dist_1 = ____('____ ~ ____', data = ____, family = ____).____
# Check the difference in deviance of model_dist_1 and model_dist
print('Difference in deviance is: ', round(____.____ - ____.____,3))