Uso de la matriz de predictores
Una decisión importante cuando usas imputación basada en modelos es qué variables incluir como predictoras y en qué modelos. En mice(), esto se controla con la matriz de predictores y, de forma predeterminada, todas las variables se usan para imputar a las demás.
Si hay muchas variables en los datos o poco tiempo para hacer una selección de modelo adecuada, puedes usar la funcionalidad de mice para crear una matriz de predictores basada en las correlaciones entre variables. Esta matriz se puede pasar a mice(). En este ejercicio practicarás precisamente esto: primero construirás una matriz de predictores de modo que cada variable se impute utilizando las variables más correlacionadas con ella; después, pasarás tu matriz de predictores a la función de imputación. ¡Probemos esta selección de modelo sencilla!
Este ejercicio forma parte del curso
Tratamiento de datos faltantes con imputaciones en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create predictor matrix with minimum correlation of 0.1
pred_mat <- ___(biopics, mincor = ___)