ComenzarEmpieza gratis

Realizar resúmenes agrupados de valores ausentes

Ahora que puedes crear datos nabulares, vamos a usarlos para explorar los datos. Calcularemos estadísticas resumidas en función de la ausencia de valores en otra variable.

Para ello vamos a seguir estos pasos:

  • Primero, bind_shadow() convierte los datos en datos nabulares.

  • Después, realiza algunos resúmenes sobre los datos usando group_by() y summarize() para calcular la media y la desviación estándar, con las funciones mean() y sd().

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

  • Para el conjunto de datos oceanbuoys:

  • Aplica bind_shadow(), luego group_by() para la ausencia de valores en humedad (humidity_NA) y calcula las medias y desviaciones estándar del viento este-oeste (wind_ew) usando summarize() de dplyr.

  • Repite esto, pero calculando los resúmenes para el viento norte-sur (wind_ns).

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
  ___() %>%
  group_by(___) %>% 
  summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
            wind_ew_sd = ___)) # calculate standard deviation of wind_ew
  
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
  ___ %>%
  group_by(___) %>%
  summarize(___ = ___(___),
            ___ = ___(___))
Editar y ejecutar código