Gestire la multicollinearità
Nel precedente esercizio hai scoperto che nel tuo modello è presente multicollinearità esaminando i valori VIF delle variabili indipendenti. Segui i passaggi sotto per rimuovere la multicollinearità:
- Passaggio 1: Calcola il VIF del modello
- Passaggio 2: Verifica se qualche variabile ha un VIF maggiore o uguale a 5
- Passaggio 2a: Rimuovi la variabile dal modello se ha un VIF maggiore o uguale a 5
- Passaggio 2b: Se ci sono più variabili con VIF maggiore di 5, rimuovi solo la variabile con il VIF più alto
- Passaggio 3: Ripeti i passaggi 1 e 2 finché il VIF di tutte le variabili non è inferiore a 5
Questo esercizio fa parte del corso
HR Analytics: prevedere il turnover dei dipendenti in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Remove level
model_1 <- glm(turnover ~ . - ___, family = "binomial",
data = train_set_multi)
# Check multicollinearity again
___
# Which variable has the highest VIF value?
highest <- ___