Evaluar imputaciones: en muchas variables
Hasta ahora hemos visto formas de analizar variables individuales o pares de variables y sus valores imputados. Sin embargo, a veces querrás revisar imputaciones para muchas variables. Para ello, necesitas hacer algo de preparación y reestructuración de los datos. Esta lección explica cómo realizar este trabajo de wrangling, que puede complicarse un poco cuando se usa con datos nabular. La función shadow_long() deja los datos con la forma adecuada para este tipo de visualizaciones.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
- Usa
shadow_long()para reunir los datos imputados deocean_imp_mean, centrándote enhumidityyair_temp_c. - Imprime los datos e inspecciónalos.
- Explora las imputaciones con un histograma usando
geom_histogram(), poniendo los valores en el eje x, rellenando según su ausencia y separando porvariable.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Gather the imputed data
ocean_imp_mean_gather <- shadow_long(___,
___,
___))
# Inspect the data
___
# Explore the imputations in a histogram
ggplot(ocean_imp_mean_gather,
aes(x = value, fill = value_NA)) +
geom_histogram() +
facet_wrap(~variable)