Het effect van multicollineariteit
Met de crab-gegevensset ga je de effecten van multicollineariteit analyseren. Denk eraan dat multicollineariteit de volgende effecten kan hebben:
- Coëfficiënt is niet significant, maar de variabele is sterk gecorreleerd met \(y\).
- Het toevoegen/verwijderen van een variabele verandert coëfficiënten aanzienlijk.
- Niet-logisch teken van de coëfficiënt.
- Variabelen hebben een hoge paargewijze correlatie.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Oefeninstructies
- Importeer de noodzakelijke functies uit de
statsmodels-bibliotheek voor GLM's. - Pas een multivariabel logistiek regressiemodel toe met
weightenwidthals verklarende variabelen enyals respons. - Bekijk de modelresultaten met de functie
print().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm
# Define model formula
formula = '____ ~ ____'
# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____
# Print model summary
____(____.____)