LoslegenKostenlos loslegen

Umgang mit Multikollinearität

In der vorherigen Übung hast du anhand der VIF-Werte der unabhängigen Variablen festgestellt, dass in deinem Modell Multikollinearität vorliegt. Folge diesen Schritten, um sie zu beseitigen:

  • Schritt 1: Berechne den VIF des Modells
  • Schritt 2: Prüfe, ob eine Variable einen VIF größer oder gleich 5 hat
    • Schritt 2a: Entferne die Variable aus dem Modell, wenn ihr VIF größer oder gleich 5 ist
    • Schritt 2b: Gibt es mehrere Variablen mit VIF größer als 5, entferne nur die Variable mit dem höchsten VIF
  • Schritt 3: Wiederhole die Schritte 1 und 2, bis der VIF aller Variablen kleiner als 5 ist

Diese Übung ist Teil des Kurses

HR Analytics: Mitarbeiterfluktuation in R vorhersagen

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Remove level
model_1 <- glm(turnover ~ . - ___, family = "binomial", 
               data = train_set_multi)

# Check multicollinearity again
___

# Which variable has the highest VIF value?
highest <- ___
Code bearbeiten und ausführen