Detección de multicolinealidad
En este ejercicio, comprobarás la multicolinealidad entre todas las variables usando el Factor de Inflación de la Varianza (VIF). Puedes calcular el VIF con la función vif() del paquete car.
Los valores de VIF están disponibles en la columna GVIF de la salida y normalmente se muestran en formato exponencial. Si no estás familiarizado con este formato, puedes usar la función format():
sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)
"22130000000"
Este ejercicio forma parte del curso
Analítica de RR. HH.: Predicción de la rotación de empleados en R
Instrucciones del ejercicio
- Carga el paquete
car. - Comprueba la multicolinealidad en el modelo (
multi_log) que construiste en un ejercicio anterior. - ¿Qué variable tiene el VIF más alto? Asigna el nombre de la variable como cadena a
highest.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load the car package
___
# Model you built in a previous exercise
multi_log <- glm(turnover ~ ., family = "binomial", data = train_set_multi)
# Check for multicollinearity
___
# Which variable has the highest VIF?
highest <- ___