Realizar resúmenes agrupados de valores ausentes
Ahora que puedes crear datos nabulares, vamos a usarlos para explorar los datos. Calcularemos estadísticas resumidas en función de la ausencia de valores en otra variable.
Para ello vamos a seguir estos pasos:
Primero,
bind_shadow()convierte los datos en datos nabulares.Después, realiza algunos resúmenes sobre los datos usando
group_by()ysummarize()para calcular la media y la desviación estándar, con las funcionesmean()ysd().
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Para el conjunto de datos
oceanbuoys:Aplica
bind_shadow(), luegogroup_by()para la ausencia de valores en humedad (humidity_NA) y calcula las medias y desviaciones estándar del viento este-oeste (wind_ew) usandosummarize()de dplyr.Repite esto, pero calculando los resúmenes para el viento norte-sur (
wind_ns).
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
___() %>%
group_by(___) %>%
summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
wind_ew_sd = ___)) # calculate standard deviation of wind_ew
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
___ %>%
group_by(___) %>%
summarize(___ = ___(___),
___ = ___(___))