Aan de slagGa gratis aan de slag

Pas een multivariabele logistische regressie toe

Met de kennis uit de video ga je terug naar de crab-gegevensset om een multivariabel logistisch regressiemodel te fitten. In hoofdstuk 2 heb je een logistische regressie gefit met width als verklarende variabele. In deze oefening onderzoek je het effect van het toevoegen van color als extra variabele.

De variabele color heeft een natuurlijke ordening van medium light, medium, medium dark en dark. color is dus een ordinale variabele, die je in dit voorbeeld als een kwantitatieve variabele zult behandelen.

De crab-gegevensset is al voor je geladen in de werkruimte. Merk ook op dat het enige verschil met de univariate code in het formula-argument zit, waar je nu structuur toevoegt om de nieuwe variabele op te nemen.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Oefeninstructies

  • Importeer de benodigde functies uit de statsmodels-bibliotheek voor GLM's.
  • Definieer het formula-argument waarbij width en color de verklarende variabelen zijn en y de respons is.
  • Fit een multivariabel logistisch regressiemodel met de functie glm().
  • Print de modelresultaten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm

# Define model formula
formula = '____ ~ ____'

# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____

# Print model summary
____(____.____)
Code bewerken en uitvoeren