ComeçarComece de graça

Fazendo resumos agrupados da ausência de dados

Agora que você pode criar dados nabulares, vamos usá-los para explorar os dados. Vamos calcular estatísticas de resumo com base na ausência de dados de outra variável.

Para fazer isso, vamos seguir estas etapas:

  • Primeiro, bind_shadow() transforma os dados em dados nabulares.

  • Em seguida, faça alguns resumos nos dados usando group_by() e summarize() para calcular a média e o desvio padrão, com as funções mean() e sd().

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

  • Para o conjunto de dados oceanbuoys:

  • Aplique bind_shadow(), depois group_by() para a ausência de dados de humidity (humidity_NA) e calcule as médias e desvios padrão para o vento leste-oeste (wind_ew) usando summarize() do dplyr.

  • Repita o processo, mas calculando resumos para o vento norte-sul (wind_ns).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
  ___() %>%
  group_by(___) %>% 
  summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
            wind_ew_sd = ___)) # calculate standard deviation of wind_ew
  
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
  ___ %>%
  group_by(___) %>%
  summarize(___ = ___(___),
            ___ = ___(___))
Editar e executar o código