Aan de slagGa gratis aan de slag

Model stap voor stap fitten

In het videocollege heb je de belangrijkste onderdelen geleerd voor het fitten van een GLM in Python met het statsmodels-pakket. In deze oefening stel je de componenten van de GLM stap voor stap samen en fit je het model uiteindelijk met de methode .fit().

De dataset die je gebruikt gaat over de verontreiniging van grondwater met arseen in Bangladesh, waarbij we de beslissing van huishoudens willen modelleren om van de huidige put over te stappen.
De kolommen in de dataset zijn:

  • switch: 1 als er van de huidige put is overgestapt; 0 anders
  • arsenic: Het niveau van arseenverontreiniging in de put
  • distance: Afstand tot de dichtstbijzijnde bekende veilige put
  • education: Aantal jaren onderwijs van het hoofd van het huishouden

De gegevensset wells is al voor je ingeladen in de werkruimte.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define the formula the the logistic model
model_formula = '____ ~ ____'
Code bewerken en uitvoeren