ComenzarEmpieza gratis

Evaluar imputaciones: en muchas variables

Hasta ahora hemos visto formas de analizar variables individuales o pares de variables y sus valores imputados. Sin embargo, a veces querrás revisar imputaciones para muchas variables. Para ello, necesitas hacer algo de preparación y reestructuración de los datos. Esta lección explica cómo realizar este trabajo de wrangling, que puede complicarse un poco cuando se usa con datos nabular. La función shadow_long() deja los datos con la forma adecuada para este tipo de visualizaciones.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

  • Usa shadow_long() para reunir los datos imputados de ocean_imp_mean, centrándote en humidity y air_temp_c.
  • Imprime los datos e inspecciónalos.
  • Explora las imputaciones con un histograma usando geom_histogram(), poniendo los valores en el eje x, rellenando según su ausencia y separando por variable.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Gather the imputed data 
ocean_imp_mean_gather <- shadow_long(___,
                                     ___,
                                     ___))
# Inspect the data
___

# Explore the imputations in a histogram 
ggplot(ocean_imp_mean_gather, 
       aes(x = value, fill = value_NA)) + 
  geom_histogram() + 
  facet_wrap(~variable)
Editar y ejecutar código