CommencerCommencer gratuitement

Coefficients en termes de cotes (odds)

Vous avez précédemment ajusté un modèle de régression logistique pour la probabilité de changer de puits en fonction du niveau d’arsenic. Dans cet exercice, vous allez examiner comment une autre variable, distance100, est liée à la probabilité de changer de puits et interpréter les coefficients en termes de cotes (odds).

Rappelez-vous que la régression logistique est exprimée en log-cotes. Ainsi, pour savoir de combien les cotes sont multipliées pour une augmentation d’une unité de x, il faut exponentier les estimations des coefficients. On parle aussi de rapport de cotes (odds ratio).

Souvenez-vous que les cotes correspondent au ratio entre la survenue de l’événement et sa non-survenue. Par exemple, si les cotes de gagner une partie sont de 1/2 ou 1 pour 2 (1:2), cela signifie que pour une victoire, il y a deux défaites.

Le jeu de données wells est chargé dans l’espace de travail.

Cet exercice fait partie du cours

Modèles linéaires généralisés en Python

Afficher le cours

Instructions

  • Importez la bibliothèque statsmodels et la fonction glm depuis statsmodels.formula.api. Importez aussi numpy sous le nom np.
  • À l’aide de glm(), ajustez un modèle de régression logistique où switch est expliqué par distance100.
  • Extrayez les coefficients du modèle avec .params.
  • Calculez l’effet multiplicatif sur les cotes à l’aide de la fonction exp() de numpy.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____

# Fit logistic regression model
model_GLM = ____(formula = ____,
                data = ____,
                family = ____.____.____).____ 

# Extract model coefficients
print('Model coefficients: \n', ____.____)

# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))
Modifier et exécuter le code