Pas een multivariabele logistische regressie toe
Met de kennis uit de video ga je terug naar de crab-gegevensset om een multivariabel logistisch regressiemodel te fitten. In hoofdstuk 2 heb je een logistische regressie gefit met width als verklarende variabele. In deze oefening onderzoek je het effect van het toevoegen van color als extra variabele.
De variabele color heeft een natuurlijke ordening van medium light, medium, medium dark en dark. color is dus een ordinale variabele, die je in dit voorbeeld als een kwantitatieve variabele zult behandelen.
De crab-gegevensset is al voor je geladen in de werkruimte. Merk ook op dat het enige verschil met de univariate code in het formula-argument zit, waar je nu structuur toevoegt om de nieuwe variabele op te nemen.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Oefeninstructies
- Importeer de benodigde functies uit de
statsmodels-bibliotheek voor GLM's. - Definieer het
formula-argument waarbijwidthencolorde verklarende variabelen zijn enyde respons is. - Fit een multivariabel logistisch regressiemodel met de functie
glm(). - Print de modelresultaten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm
# Define model formula
formula = '____ ~ ____'
# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____
# Print model summary
____(____.____)