Déviance et transformation linéaire
Comme vous l’avez vu dans les exercices précédents, la déviance diminue lorsque vous ajoutez une variable qui améliore l’ajustement du modèle. Dans cet exercice, vous allez reprendre l’exemple des puits et le modèle ajusté avec la variable distance, mais vous évaluerez ce qui se passe lorsqu’on applique une transformation linéaire à la variable.
Notez que la variable distance100 correspond à la variable d’origine distance divisée par 100, afin d’obtenir une représentation et une interprétation des résultats plus parlantes. Vous pouvez examiner les données avec wells.head() pour afficher les 5 premières lignes.
Le jeu de données wells et le modèle 'swicth ~ distance100' ont été préchargés sous le nom model_dist.
Cet exercice fait partie du cours
Modèles linéaires généralisés en Python
Instructions
- Importez
statsmodelssous le nomsmainsi que la fonctionglm(). - Ajustez un modèle de régression logistique avec
distancecomme variable explicative etswitchcomme variable réponse, et enregistrez-le dansmodel_dist_1. - Vérifiez et affichez la différence de déviance entre le modèle courant et le modèle avec
distance100comme variable explicative.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import functions
import ____.api as ____
from ____.____.api import ____
# Fit logistic regression model as save as model_dist_1
model_dist_1 = ____('____ ~ ____', data = ____, family = ____).____
# Check the difference in deviance of model_dist_1 and model_dist
print('Difference in deviance is: ', round(____.____ - ____.____,3))