CommencerCommencer gratuitement

Ajuster une régression logistique multivariable

En vous appuyant sur la vidéo, vous allez revenir au jeu de données crab pour ajuster un modèle de régression logistique multivariable. Au chapitre 2, vous avez ajusté une régression logistique avec width comme variable explicative. Dans cet exercice, vous allez analyser l’effet d’ajouter color comme variable supplémentaire.

La variable color a un ordre naturel : medium light, medium, medium dark et dark. Ainsi, color est une variable ordinale que, dans cet exemple, vous traiterez comme une variable quantitative.

Le jeu de données crab est préchargé dans l’espace de travail. Notez également que la seule différence par rapport au cas univarié se situe dans l’argument de formule, où vous allez maintenant ajouter la structure nécessaire pour intégrer la nouvelle variable.

Cet exercice fait partie du cours

Modèles linéaires généralisés en Python

Afficher le cours

Instructions

  • Importez les fonctions nécessaires de la bibliothèque statsmodels pour les GLM.
  • Définissez l’argument formulawidth et color sont les variables explicatives et y la réponse.
  • Ajustez un modèle de régression logistique multivariée à l’aide de la fonction glm().
  • Affichez les résultats du modèle.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm

# Define model formula
formula = '____ ~ ____'

# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____

# Print model summary
____(____.____)
Modifier et exécuter le code