Fazendo resumos agrupados da ausência de dados
Agora que você pode criar dados nabulares, vamos usá-los para explorar os dados. Vamos calcular estatísticas de resumo com base na ausência de dados de outra variável.
Para fazer isso, vamos seguir estas etapas:
Primeiro,
bind_shadow()transforma os dados em dados nabulares.Em seguida, faça alguns resumos nos dados usando
group_by()esummarize()para calcular a média e o desvio padrão, com as funçõesmean()esd().
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Para o conjunto de dados
oceanbuoys:Aplique
bind_shadow(), depoisgroup_by()para a ausência de dados de humidity (humidity_NA) e calcule as médias e desvios padrão para o vento leste-oeste (wind_ew) usandosummarize()do dplyr.Repita o processo, mas calculando resumos para o vento norte-sul (
wind_ns).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
___() %>%
group_by(___) %>%
summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
wind_ew_sd = ___)) # calculate standard deviation of wind_ew
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
___ %>%
group_by(___) %>%
summarize(___ = ___(___),
___ = ___(___))