ComenzarEmpieza gratis

Errores de imputación por variable

En el ejercicio anterior has extraído los errores de imputación estimados del resultado de missForest. Esto te dio dos números:

  • el error cuadrático medio de la raíz normalizado (NRMSE) para todas las variables continuas;
  • la proporción de entradas clasificadas erróneamente (PFC) para todas las variables categóricas.

Sin embargo, puede que el modelo de imputación funcione muy bien para una variable continua y mal para otra. Para diagnosticar estos casos, basta con indicarle a missForest que calcule estimaciones de error por variable. Esto se hace estableciendo el argumento variablewise a TRUE.

Los datos de biopics y el paquete missForest ya están cargados, así que ¡vamos a revisar los errores más de cerca!

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)
Editar y ejecutar código