Outros resumos de ausência de dados
Alguns resumos de ausência de dados são especialmente úteis para diferentes tipos de dados. Por exemplo, miss_var_span() e miss_var_run().
miss_var_span()calcula o número de valores ausentes em uma variável especificada para um intervalo repetido. Isso é muito útil em séries temporais para investigar padrões semanais (7 dias) de ausência de dados.miss_var_run()calcula o número de "runs" ou "sequências" de ausência de dados. Isso é útil para encontrar padrões incomuns de ausência; por exemplo, você pode identificar um padrão repetido de 5 completos e 5 ausentes.
Tanto miss_var_span() quanto miss_var_run() funcionam com o operador group_by do dplyr.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando o conjunto de dados pedestrian do naniar:
- Calcule resumos de ausência de dados para as variáveis nos dados usando
miss_var_span(), para um intervalo de 4000. - Calcule resumos de ausência de dados para os casos nos dados usando
miss_var_run(). - Combine com o operador
group_bydo dplyr paramonth.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the summaries for each run of missingness for the variable, hourly_counts
miss_var_run(pedestrian, var = ___)
# Calculate the summaries for each span of missingness,
# for a span of 4000, for the variable hourly_counts
miss_var_span(pedestrian, var = ___, span_every = ___)
# For each `month` variable, calculate the run of missingness for hourly_counts
pedestrian %>% group_by(month) %>% ___()
# For each `month` variable, calculate the span of missingness
# of a span of 2000, for the variable hourly_counts
pedestrian %>% group_by(___) %>% ___(var = ___, span_every = ___)