Explora la variación por ausencia de datos: diagramas de caja
En los ejercicios anteriores se usaron datos nabular junto con gráficos de densidad para explorar la variación de una variable según la ausencia de datos en otra.
Ahora vamos a usar el conjunto de datos oceanbuoys de naniar, empleando diagramas de caja en lugar de facetas u otras opciones para explorar distintos niveles de ausencia de datos.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
- Explora la distribución del viento este-oeste (
wind_ew) en función de la ausencia de datos de la temperatura del aire usandogeom_boxplot(). - Amplía esta visualización aplicando facetas según la ausencia de datos de la humedad (
humidity_NA).
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Explore the distribution of wind east west (`wind_ew`) for
# the missingness of air temperature using `geom_boxplot()`
oceanbuoys %>%
bind_shadow() %>%
ggplot(aes(x = air_temp_c___,
y = ____)) +
geom_____()
# Build upon this visualization by faceting by the missingness of humidity (`humidity_NA`).
oceanbuoys %>%
___() %>%
ggplot(aes(x = ___,
y = ___)) +
geom_____() +
facet_wrap(~___)