Omgaan met multicollineariteit
In de vorige oefening ontdekte je dat er multicollineariteit in je model zit door de VIF-waarden van de onafhankelijke variabelen te bekijken. Volg de stappen hieronder om multicollineariteit te verwijderen:
- Stap 1: Bereken de VIF van het model
- Stap 2: Kijk of een variabele een VIF heeft die groter dan of gelijk is aan 5
- Stap 2a: Verwijder de variabele uit het model als de VIF groter dan of gelijk is aan 5
- Stap 2b: Als er meerdere variabelen een VIF groter dan 5 hebben, verwijder dan alleen de variabele met de hoogste VIF
- Stap 3: Herhaal stappen 1 en 2 totdat de VIF van alle variabelen lager is dan 5
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Remove level
model_1 <- glm(turnover ~ . - ___, family = "binomial",
data = train_set_multi)
# Check multicollinearity again
___
# Which variable has the highest VIF value?
highest <- ___