Rilevare la multicollinearità
In questo esercizio controllerai la multicollinearità tra tutte le variabili usando il Variance Inflation Factor (VIF). Puoi calcolare il VIF con la funzione vif() del pacchetto car.
I valori di VIF sono disponibili nella colonna GVIF dell'output e di solito sono stampati in formato esponenziale. Se non conosci questo formato, puoi usare la funzione format():
sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)
"22130000000"
Questo esercizio fa parte del corso
HR Analytics: prevedere il turnover dei dipendenti in R
Istruzioni dell'esercizio
- Carica il pacchetto
car. - Verifica la multicollinearità nel modello (
multi_log) che hai costruito in un esercizio precedente. - Quale variabile ha il VIF più alto? Assegna il nome della variabile come stringa a
highest.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the car package
___
# Model you built in a previous exercise
multi_log <- glm(turnover ~ ., family = "binomial", data = train_set_multi)
# Check for multicollinearity
___
# Which variable has the highest VIF?
highest <- ___