Umgang mit Multikollinearität
In der vorherigen Übung hast du anhand der VIF-Werte der unabhängigen Variablen festgestellt, dass in deinem Modell Multikollinearität vorliegt. Folge diesen Schritten, um sie zu beseitigen:
- Schritt 1: Berechne den VIF des Modells
- Schritt 2: Prüfe, ob eine Variable einen VIF größer oder gleich 5 hat
- Schritt 2a: Entferne die Variable aus dem Modell, wenn ihr VIF größer oder gleich 5 ist
- Schritt 2b: Gibt es mehrere Variablen mit VIF größer als 5, entferne nur die Variable mit dem höchsten VIF
- Schritt 3: Wiederhole die Schritte 1 und 2, bis der VIF aller Variablen kleiner als 5 ist
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation in R vorhersagen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Remove level
model_1 <- glm(turnover ~ . - ___, family = "binomial",
data = train_set_multi)
# Check multicollinearity again
___
# Which variable has the highest VIF value?
highest <- ___