Multikollinearität erkennen
In dieser Übung prüfst du mit dem Variance Inflation Factor (VIF) die Multikollinearität zwischen allen Variablen. Den VIF kannst du mit der Funktion vif() aus dem Paket car berechnen.
Die VIF-Werte findest du in der Spalte GVIF der Ausgabe; sie werden meist im Exponentialformat ausgegeben. Wenn dir dieses Format nicht vertraut ist, kannst du die Funktion format() verwenden:
sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)
"22130000000"
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation in R vorhersagen
Anleitung zur Übung
- Lade das Paket
car. - Prüfe die Multikollinearität in dem Modell (
multi_log), das du in einer früheren Übung erstellt hast. - Welche Variable hat den höchsten VIF? Weise den Variablennamen als String
highestzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the car package
___
# Model you built in a previous exercise
multi_log <- glm(turnover ~ ., family = "binomial", data = train_set_multi)
# Check for multicollinearity
___
# Which variable has the highest VIF?
highest <- ___