Visualiza los valores imputados en un diagrama de dispersión
Ahora, vamos a recrear uno de los gráficos anteriores que vimos en el capítulo tres y que usaba geom_miss_point().
Para ello, necesitamos imputar los datos por debajo del rango del propio conjunto. Esta es una imputación especial para explorar los datos. Con esta imputación veremos lo que necesitamos practicar: cómo rastrear los valores perdidos. Para imputar por debajo del rango de los datos, usamos la función impute_below_all().
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Usando los datos de oceanbuoys:
- Imputa y rastrea los valores perdidos con
bind_shadow(),impute_below_all()yadd_label_shadow(). - Visualiza la ausencia de datos en viento y temperatura del aire en los ejes x e y, respectivamente, coloreando los valores faltantes de temperatura del aire con
air_temp_c_NA. - Visualiza humedad y temperatura del aire en los ejes x e y, respectivamente, coloreando cualquier caso con valores perdidos usando la variable
any_missing.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>%
impute_below_all() %>%
add_label_shadow()
# Visualize the missingness in wind and air temperature,
# coloring missing air temp values with air_temp_c_NA
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()