ComenzarEmpieza gratis

Otras formas de resumir la ausencia de datos

Algunos resúmenes de ausencia de datos son especialmente útiles para distintos tipos de datos. Por ejemplo, miss_var_span() y miss_var_run().

  • miss_var_span() calcula el número de valores ausentes en una variable específica para un intervalo repetido. Esto es muy útil en datos de series temporales para detectar patrones semanales (7 días) de ausencia.

  • miss_var_run() calcula el número de «rachas» o «secuencias» de ausencia. Esto ayuda a encontrar patrones inusuales; por ejemplo, podrías encontrar un patrón repetido de 5 completos y 5 ausentes.

Tanto miss_var_span() como miss_var_run() funcionan con el operador group_by de dplyr.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

Usando el conjunto de datos pedestrian de naniar:

  • Calcula resúmenes de ausencia de datos para las variables del conjunto de datos usando miss_var_span(), para un intervalo de 4000.
  • Calcula resúmenes de ausencia de datos para los casos del conjunto de datos usando miss_var_run().
  • Combina con el operador group_by de dplyr para month.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the summaries for each run of missingness for the variable, hourly_counts
miss_var_run(pedestrian, var = ___)

# Calculate the summaries for each span of missingness, 
# for a span of 4000, for the variable hourly_counts
miss_var_span(pedestrian, var = ___, span_every = ___)

# For each `month` variable, calculate the run of missingness for hourly_counts
pedestrian %>% group_by(month) %>% ___()

# For each `month` variable, calculate the span of missingness 
# of a span of 2000, for the variable hourly_counts
pedestrian %>% group_by(___) %>% ___(var = ___, span_every = ___)
Editar y ejecutar código