L’effet de la multicolinéarité
À l’aide du jeu de données crab, vous allez analyser les effets de la multicolinéarité. Rappelez-vous que la multicolinéarité peut avoir les effets suivants :
- Le coefficient n’est pas significatif alors que la variable est fortement corrélée à \(y\).
- L’ajout ou la suppression d’une variable modifie fortement les coefficients.
- Signe du coefficient non logique.
- Les variables présentent une forte corrélation par paires.
Cet exercice fait partie du cours
Modèles linéaires généralisés en Python
Instructions
- Importez les fonctions nécessaires de la bibliothèque
statsmodelspour les GLM. - Ajustez un modèle de régression logistique multivariée avec
weightetwidthcomme variables explicatives etycomme variable réponse. - Affichez les résultats du modèle avec la fonction
print().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm
# Define model formula
formula = '____ ~ ____'
# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____
# Print model summary
____(____.____)