IniziaInizia gratis

Gestire la multicollinearità

Nel precedente esercizio hai scoperto che nel tuo modello è presente multicollinearità esaminando i valori VIF delle variabili indipendenti. Segui i passaggi sotto per rimuovere la multicollinearità:

  • Passaggio 1: Calcola il VIF del modello
  • Passaggio 2: Verifica se qualche variabile ha un VIF maggiore o uguale a 5
    • Passaggio 2a: Rimuovi la variabile dal modello se ha un VIF maggiore o uguale a 5
    • Passaggio 2b: Se ci sono più variabili con VIF maggiore di 5, rimuovi solo la variabile con il VIF più alto
  • Passaggio 3: Ripeti i passaggi 1 e 2 finché il VIF di tutte le variabili non è inferiore a 5

Questo esercizio fa parte del corso

HR Analytics: prevedere il turnover dei dipendenti in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Remove level
model_1 <- glm(turnover ~ . - ___, family = "binomial", 
               data = train_set_multi)

# Check multicollinearity again
___

# Which variable has the highest VIF value?
highest <- ___
Modifica ed esegui il codice