IniziaInizia gratis

Rilevare la multicollinearità

In questo esercizio controllerai la multicollinearità tra tutte le variabili usando il Variance Inflation Factor (VIF). Puoi calcolare il VIF con la funzione vif() del pacchetto car.

I valori di VIF sono disponibili nella colonna GVIF dell'output e di solito sono stampati in formato esponenziale. Se non conosci questo formato, puoi usare la funzione format():

sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)

"22130000000"

Questo esercizio fa parte del corso

HR Analytics: prevedere il turnover dei dipendenti in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto car.
  • Verifica la multicollinearità nel modello (multi_log) che hai costruito in un esercizio precedente.
  • Quale variabile ha il VIF più alto? Assegna il nome della variabile come stringa a highest.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the car package
___

# Model you built in a previous exercise
multi_log <- glm(turnover ~ ., family = "binomial", data = train_set_multi)

# Check for multicollinearity
___

# Which variable has the highest VIF?
highest <- ___
Modifica ed esegui il codice