Deviantie en lineaire transformatie
Zoals je in eerdere oefeningen hebt gezien, neemt de deviantie af wanneer je een variabele toevoegt die de model-fit verbetert. In deze oefening kijk je naar het voorbeeld met de waterpompdata en het model dat je hebt gefit met de variabele distance, maar je beoordeelt wat er gebeurt wanneer er een lineaire transformatie van de variabele is.
Let op: de variabele distance100 is de oorspronkelijke variabele distance gedeeld door 100, zodat de resultaten betekenisvoller te presenteren en te interpreteren zijn. Je kunt de gegevens bekijken met wells.head() om de eerste 5 rijen te zien.
De wells-gegevensset en het model 'swicth ~ distance100' zijn vooraf geladen als model_dist.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Oefeninstructies
- Importeer
statsmodelsalssmen de functieglm(). - Fit een logistisch regressiemodel met
distanceals verklarende variabele enswitchals respons en sla dit op alsmodel_dist_1. - Controleer en print het verschil in deviantie tussen het huidige model en het model met
distance100als verklarende variabele.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import functions
import ____.api as ____
from ____.____.api import ____
# Fit logistic regression model as save as model_dist_1
model_dist_1 = ____('____ ~ ____', data = ____, family = ____).____
# Check the difference in deviance of model_dist_1 and model_dist
print('Difference in deviance is: ', round(____.____ - ____.____,3))