Aan de slagGa gratis aan de slag

Het effect van multicollineariteit

Met de crab-gegevensset ga je de effecten van multicollineariteit analyseren. Denk eraan dat multicollineariteit de volgende effecten kan hebben:

  • Coëfficiënt is niet significant, maar de variabele is sterk gecorreleerd met \(y\).
  • Het toevoegen/verwijderen van een variabele verandert coëfficiënten aanzienlijk.
  • Niet-logisch teken van de coëfficiënt.
  • Variabelen hebben een hoge paargewijze correlatie.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Oefeninstructies

  • Importeer de noodzakelijke functies uit de statsmodels-bibliotheek voor GLM's.
  • Pas een multivariabel logistiek regressiemodel toe met weight en width als verklarende variabelen en y als respons.
  • Bekijk de modelresultaten met de functie print().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm

# Define model formula
formula = '____ ~ ____'

# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____

# Print model summary
____(____.____)
Code bewerken en uitvoeren