Ajuster une régression logistique multivariable
En vous appuyant sur la vidéo, vous allez revenir au jeu de données crab pour ajuster un modèle de régression logistique multivariable. Au chapitre 2, vous avez ajusté une régression logistique avec width comme variable explicative. Dans cet exercice, vous allez analyser l’effet d’ajouter color comme variable supplémentaire.
La variable color a un ordre naturel : medium light, medium, medium dark et dark. Ainsi, color est une variable ordinale que, dans cet exemple, vous traiterez comme une variable quantitative.
Le jeu de données crab est préchargé dans l’espace de travail. Notez également que la seule différence par rapport au cas univarié se situe dans l’argument de formule, où vous allez maintenant ajouter la structure nécessaire pour intégrer la nouvelle variable.
Cet exercice fait partie du cours
Modèles linéaires généralisés en Python
Instructions
- Importez les fonctions nécessaires de la bibliothèque
statsmodelspour les GLM. - Définissez l’argument
formulaoùwidthetcolorsont les variables explicatives etyla réponse. - Ajustez un modèle de régression logistique multivariée à l’aide de la fonction
glm(). - Affichez les résultats du modèle.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm
# Define model formula
formula = '____ ~ ____'
# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____
# Print model summary
____(____.____)