ComeçarComece de graça

Outros resumos de ausência de dados

Alguns resumos de ausência de dados são especialmente úteis para diferentes tipos de dados. Por exemplo, miss_var_span() e miss_var_run().

  • miss_var_span() calcula o número de valores ausentes em uma variável especificada para um intervalo repetido. Isso é muito útil em séries temporais para investigar padrões semanais (7 dias) de ausência de dados.

  • miss_var_run() calcula o número de "runs" ou "sequências" de ausência de dados. Isso é útil para encontrar padrões incomuns de ausência; por exemplo, você pode identificar um padrão repetido de 5 completos e 5 ausentes.

Tanto miss_var_span() quanto miss_var_run() funcionam com o operador group_by do dplyr.

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

Usando o conjunto de dados pedestrian do naniar:

  • Calcule resumos de ausência de dados para as variáveis nos dados usando miss_var_span(), para um intervalo de 4000.
  • Calcule resumos de ausência de dados para os casos nos dados usando miss_var_run().
  • Combine com o operador group_by do dplyr para month.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Calculate the summaries for each run of missingness for the variable, hourly_counts
miss_var_run(pedestrian, var = ___)

# Calculate the summaries for each span of missingness, 
# for a span of 4000, for the variable hourly_counts
miss_var_span(pedestrian, var = ___, span_every = ___)

# For each `month` variable, calculate the run of missingness for hourly_counts
pedestrian %>% group_by(month) %>% ___()

# For each `month` variable, calculate the span of missingness 
# of a span of 2000, for the variable hourly_counts
pedestrian %>% group_by(___) %>% ___(var = ___, span_every = ___)
Editar e executar o código