Aan de slagGa gratis aan de slag

Omgaan met multicollineariteit

In de vorige oefening ontdekte je dat er multicollineariteit in je model zit door de VIF-waarden van de onafhankelijke variabelen te bekijken. Volg de stappen hieronder om multicollineariteit te verwijderen:

  • Stap 1: Bereken de VIF van het model
  • Stap 2: Kijk of een variabele een VIF heeft die groter dan of gelijk is aan 5
    • Stap 2a: Verwijder de variabele uit het model als de VIF groter dan of gelijk is aan 5
    • Stap 2b: Als er meerdere variabelen een VIF groter dan 5 hebben, verwijder dan alleen de variabele met de hoogste VIF
  • Stap 3: Herhaal stappen 1 en 2 totdat de VIF van alle variabelen lager is dan 5

Deze oefening maakt deel uit van de cursus

HR-analytics: verloop van medewerkers voorspellen in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Remove level
model_1 <- glm(turnover ~ . - ___, family = "binomial", 
               data = train_set_multi)

# Check multicollinearity again
___

# Which variable has the highest VIF value?
highest <- ___
Code bewerken en uitvoeren