Coefficienti in termini di odds
In precedenza hai adattato un modello di regressione logistica per la probabilità di cambiare pozzo dato il livello di arsenic. In questo esercizio vedrai come un'altra variabile, distance100, è collegata alla probabilità di cambiare e interpreterai i coefficienti in termini di odds.
Ricorda che la regressione logistica è espressa in termini di log-odds, quindi per ottenere di quanto si moltiplicano le odds a seguito di un aumento unitario in x devi esponenziare le stime dei coefficienti. Questo è chiamato anche odds ratio.
Ricorda che le odds sono il rapporto tra il verificarsi dell'evento e il non verificarsi dell'evento. Per esempio, se le odds di vincere una partita sono 1/2 o 1 a 2 (1:2), significa che per ogni vittoria ci sono 2 sconfitte.
L'insieme di dati wells è caricato nell'ambiente di lavoro.
Questo esercizio fa parte del corso
Modelli lineari generalizzati in Python
Istruzioni dell'esercizio
- Importa la libreria
statsmodelse la funzioneglmdastatsmodels.formula.api. Importa anchenumpycomenp. - Usando
glm()adatta un modello di regressione logistica in cuiswitchè predetta dadistance100. - Estrai i coefficienti del modello usando
.params. - Calcola l'effetto moltiplicativo sulle odds usando la funzione
exp()dinumpy.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____
# Fit logistic regression model
model_GLM = ____(formula = ____,
data = ____,
family = ____.____.____).____
# Extract model coefficients
print('Model coefficients: \n', ____.____)
# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))