ComenzarEmpieza gratis

Visualiza los valores imputados en un diagrama de dispersión

Ahora, vamos a recrear uno de los gráficos anteriores que vimos en el capítulo tres y que usaba geom_miss_point().

Para ello, necesitamos imputar los datos por debajo del rango del propio conjunto. Esta es una imputación especial para explorar los datos. Con esta imputación veremos lo que necesitamos practicar: cómo rastrear los valores perdidos. Para imputar por debajo del rango de los datos, usamos la función impute_below_all().

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

Usando los datos de oceanbuoys:

  • Imputa y rastrea los valores perdidos con bind_shadow(), impute_below_all() y add_label_shadow().
  • Visualiza la ausencia de datos en viento y temperatura del aire en los ejes x e y, respectivamente, coloreando los valores faltantes de temperatura del aire con air_temp_c_NA.
  • Visualiza humedad y temperatura del aire en los ejes x e y, respectivamente, coloreando cualquier caso con valores perdidos usando la variable any_missing.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>% 
  impute_below_all() %>% 
  add_label_shadow()

# Visualize the missingness in wind and air temperature,  
# coloring missing air temp values with air_temp_c_NA
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  geom_point()

# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) +  
  geom_point()
Editar y ejecutar código