Variables correlacionadas
En este ejercicio, vas a inspeccionar el conjunto de datos para detectar variables correlacionadas. Es importante eliminarlas antes de aplicar un clasificador binario, especialmente en el caso de la regresión logística. Cuando dos o más variables están muy correlacionadas, deberías eliminar todas menos una.
Primero, usaremos la función corrplot() del paquete corrplot para visualizar las correlaciones.
En el mapa de correlaciones, el azul representa una correlación positiva y el rojo una negativa.
Un color más oscuro indica una correlación más alta.
Por último, eliminarás del conjunto de datos las variables con alta correlación.
Este ejercicio forma parte del curso
Analítica predictiva con datos conectados en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Remove the Future column from studentnetworkdata
no_future <- ___
# Load the corrplot package
library(___)
# Generate the correlation matrix
M <- ___(no_future)
# Plot the correlations
___(M, method = "circle")