Aan de slagGa gratis aan de slag

Deviantie en lineaire transformatie

Zoals je in eerdere oefeningen hebt gezien, neemt de deviantie af wanneer je een variabele toevoegt die de model-fit verbetert. In deze oefening kijk je naar het voorbeeld met de waterpompdata en het model dat je hebt gefit met de variabele distance, maar je beoordeelt wat er gebeurt wanneer er een lineaire transformatie van de variabele is.

Let op: de variabele distance100 is de oorspronkelijke variabele distance gedeeld door 100, zodat de resultaten betekenisvoller te presenteren en te interpreteren zijn. Je kunt de gegevens bekijken met wells.head() om de eerste 5 rijen te zien.

De wells-gegevensset en het model 'swicth ~ distance100' zijn vooraf geladen als model_dist.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Oefeninstructies

  • Importeer statsmodels als sm en de functie glm().
  • Fit een logistisch regressiemodel met distance als verklarende variabele en switch als respons en sla dit op als model_dist_1.
  • Controleer en print het verschil in deviantie tussen het huidige model en het model met distance100 als verklarende variabele.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import functions
import ____.api as ____
from ____.____.api import ____

# Fit logistic regression model as save as model_dist_1
model_dist_1 = ____('____ ~ ____', data = ____, family = ____).____

# Check the difference in deviance of model_dist_1 and model_dist
print('Difference in deviance is: ', round(____.____ - ____.____,3))
Code bewerken en uitvoeren