Coefficients en termes de cotes (odds)
Vous avez précédemment ajusté un modèle de régression logistique pour la probabilité de changer de puits en fonction du niveau d’arsenic. Dans cet exercice, vous allez examiner comment une autre variable, distance100, est liée à la probabilité de changer de puits et interpréter les coefficients en termes de cotes (odds).
Rappelez-vous que la régression logistique est exprimée en log-cotes. Ainsi, pour savoir de combien les cotes sont multipliées pour une augmentation d’une unité de x, il faut exponentier les estimations des coefficients. On parle aussi de rapport de cotes (odds ratio).
Souvenez-vous que les cotes correspondent au ratio entre la survenue de l’événement et sa non-survenue. Par exemple, si les cotes de gagner une partie sont de 1/2 ou 1 pour 2 (1:2), cela signifie que pour une victoire, il y a deux défaites.
Le jeu de données wells est chargé dans l’espace de travail.
Cet exercice fait partie du cours
Modèles linéaires généralisés en Python
Instructions
- Importez la bibliothèque
statsmodelset la fonctionglmdepuisstatsmodels.formula.api. Importez aussinumpysous le nomnp. - À l’aide de
glm(), ajustez un modèle de régression logistique oùswitchest expliqué pardistance100. - Extrayez les coefficients du modèle avec
.params. - Calculez l’effet multiplicatif sur les cotes à l’aide de la fonction
exp()denumpy.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____
# Fit logistic regression model
model_GLM = ____(formula = ____,
data = ____,
family = ____.____.____).____
# Extract model coefficients
print('Model coefficients: \n', ____.____)
# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))