LoslegenKostenlos loslegen

Multikollinearität erkennen

In dieser Übung prüfst du mit dem Variance Inflation Factor (VIF) die Multikollinearität zwischen allen Variablen. Den VIF kannst du mit der Funktion vif() aus dem Paket car berechnen.

Die VIF-Werte findest du in der Spalte GVIF der Ausgabe; sie werden meist im Exponentialformat ausgegeben. Wenn dir dieses Format nicht vertraut ist, kannst du die Funktion format() verwenden:

sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)

"22130000000"

Diese Übung ist Teil des Kurses

HR Analytics: Mitarbeiterfluktuation in R vorhersagen

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket car.
  • Prüfe die Multikollinearität in dem Modell (multi_log), das du in einer früheren Übung erstellt hast.
  • Welche Variable hat den höchsten VIF? Weise den Variablennamen als String highest zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the car package
___

# Model you built in a previous exercise
multi_log <- glm(turnover ~ ., family = "binomial", data = train_set_multi)

# Check for multicollinearity
___

# Which variable has the highest VIF?
highest <- ___
Code bearbeiten und ausführen